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本 书 是 C++ 之 父 Bjame Stroustrup 的 最 新 力作 。 书 中 广泛 地 介绍 了 程序 设计 的 基本 概念 和 
技术 , 包括 类 型 系统 、 算 术 运 算 、 控 制 结构 、 错 误 处 理 等 ; 介绍 了 从 键盘 和 文件 获取 数值 和 文 
本 数据 的 方法 以 及 以 图 形 化 方式 表示 数值 数据 、 文 本 和 几何 图 形 ; 介绍 了 C++ 标准 库 中 的 容 
器 (如 向 量 、 列表 、 映射) 和 算法 (如 排序 、 查 找 和 内 积 ) 的 设计 和 使 用 。 同 时 还 对 C++ 思 
想 和 历史 进行 了 详细 的 讨论 , 很 好 地 拓宽 了 读者 的 视野 。 

本 书 语言 通俗 易 慌 、 实例 丰富 ， 可 作为 大 学 计算 机 、 电 子 工程 、 信息 科学 等 相关 专业 的 才 
材 ， 也 可 供 相关 专业 人 员 人 参考。 
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文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 幸 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 目 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 得 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 演 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务  。 目 1998 年 开始 ， 我 们 就 将 工 
作 重 点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson，McGraw- 
Hill，Elsevier，MIT，John Wiley 区 Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关 
系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum，Bjarne Stroustrup，Brain W. 
Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. Ullman, 
Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. 
Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 学 习 、 研 究 
及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 囊 助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ;而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改 半 的 逐 关 次 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢 迎 老 师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 ] 号 
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程序 设计 是 打开 计算 机 世界 大 门 的 金 钥匙 , 它 使 五 彩 斑 调 的 软件 对 你 来 说 不 再 是 “魔术 ”。 
C++ 语言 则 是 学 习 掌握 这 把 金 钥匙 的 有 力 武 器 , 它 优美 、 高 效 , 从 大 洋 深 处 到 火星 表面 ， 从 系统 
核心 到 高 层 应 用 , 从 掌中 的 手机 到 超级 计算 机 , 到 处 都 有 C++ 程序 的 身影 。 本 书 适合 那些 从 未 有 
过 程序 设计 经 验 的 初学 者 , 如 果 你 愿意 努力 学 习 , 本 书 能 帮助 你 理解 使 用 C++ 语言 进行 程序 设计 
的 基本 原理 及 大 量 实践 技巧 。 你 所 学 到 的 思想 , 大 多 数 也 都 可 直接 用 于 其 他 程序 设计 语言 。 本 书 
不 是 初学 程序 设计 语言 的 简单 人 门 教材 , 它 的 目标 是 能 让 读者 学 到 基本 的 实用 程序 设计 技术 , 因此 
也 可 以 作为 程序 设计 方面 的 “第 二 本 书 ”。 基 于 这 样 一 个 目标 , 注重 实践 是 本 书 的 明显 特点 。 它 希望 
教会 你 编写 真正 能 被 他 人 所 使 用 的 “有 用 的 程序 ”, 而 非 “玩具 程序 ”"。 因 此 , 除了 基本 的 C++ 程序 特 
性 之 外 , 本 书 还 介绍 了 大 量 的 求解 实际 问题 的 程序 设计 技术 : 如 语法 分 析 器 程序 的 设计 、 图 形 化 程 
序 设计 、 利 用 正则 表达 式 处 理 文本 、 数 值 计 算 程 序 设 计 以 及 嵌入 式 程 序 设计 等 。 在 其 他 大 多 数 程序 
设计 入 门 书籍 中 , 是 找 不 到 这 些 内 容 的 , 像 调试 技术 、 测试 技术 等 其 他 程序 设计 书籍 着 墨 不 多 的 话 
题 , 本 书 也 有 详细 的 介绍 。 程 序 设计 远 非 遵循 语法 规则 和 阅读 手册 那么 简单 ,而 在 于 理解 基本 思想 、 
原理 和 技术 , 并 进行 大 量 实践 。 本 书 阐述 了 这 一 理念 , 为 读者 指引 了 明确 的 方向 , 教会 读者 如 何 才 
能 达到 编写 有 用 的 、 优 美的 程序 这 一 最 终 目标 。 

本 书 的 作者 Bjame Stroustrup 是 C++ 语言 的 设计 者 和 最 初 的 实现 者 ,也 是 (The C++ Program- 
ming Language》( Addison-Wesley 出 版 社 ) 一 书 的 作者 。 他 现在 是 德州 农工 大 学 计算 机 科学 首席 教授 ， 
美国 国家 工程 院 的 会 员 和 AT&T 院士 。 在 进入 学 术 界 之 前 , 他 在 AT&T 贝尔 实验 室 工作 多 年 。 他 是 ISO 
C ++ 标准 委员 会 的 创始 人 之 一 。 本 书 是 他 在 C++ 程序 设计 领域 奉献 给 广大 读者 的 又 一 经 典 著作 。 

本 书 分 为 五 个 部 分 。 第 一 部 分 介绍 基本 的 C++ 程序 设计 知识 , 包括 第 一 个 “Hello, World!1” 
程序 , 对 象 、 类 型 和 值 , 运算 , 错误 处 理 , 函数 , 类 等 内 容 , 以 及 一 个 计算 器 程序 实例 。 第 二 部 分 
介绍 输入 和 输出 , 首先 介绍 了 输入 /输出 流 的 基本 概念 和 格式 化 输出 方法 , 然后 第 12 ~ 16 章 重 点 
介绍 了 图 形 /GUI 类 和 图 形 化 程序 设计 。 第 三 部 分 介绍 数据 结构 和 算法 , 重点 介绍 了 向 量 、 自 由 内 
存 空间 、 数 组、 模板 和 异常 、 容 器 和 迭代 器 以 及 算法 和 映射 。 第 四 部 分 希望 拓宽 读者 的 视野 , 介 
绍 了 程序 设计 语言 理念 和 历史 、 文本 处 理 技术 、 数值 计算 、 柑 入 式 程序 设计 技术 及 测试 技术 , 此 
外 还 较为 详细 地 介绍 了 C 语言 与 C++ 的 异同 。 第 五 部 分 为 附录 , 包括 C++ 语言 概要 、 标 准 库 概 
要 、Visual Studio 简要 入 门 、FLTK 安装 以 及 GUI 实现 等 内 容 。 

本 书 的 序 、 第 0 章 、8 ~11 章 、23 ~25 章 、27 章 、 附 录 、 术 语 表 由 王刚 翻译 , 第 4、5、22、 26 
章 由 刘晓光 翻译 , 第 1 ~3 章 、17 ~21 章 由 吴 英 翻译 , 第 6 ~7 章 、12 ~ 16 章 由 李涛 翻译 。 翻 译 大 
师 经 典 , 难度 超 平 想 象 。 接 受 任务 之 初 , 诚 性 诚 丽 ; 翻译 过 程 中 , 如 懂 薄 冰 ; 完成 后 , 志 下 不 安 。 
虽然 竭尽 全 力 , 但 肯定 还 有 很 多 错漏 之 处 ， 敬 请 读者 批评 指正 。 


译 者 
2010 年 4 月 于 南开 大 学 
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“该 死 的 和 鱼雷! 全 加 前 进 。” 
一 一 海军 上 将 Farragut 


程序 设计 是 这 样 一 门 艺术 , 它 将 问题 求解 方案 描述 成 计算 机 可 以 执行 的 形式 。 程 序 设计 中 很 
多 工作 都 花费 在 寻找 求解 方案 以 及 对 其 求 精 上 。 通 常 ,， 只 有 在 真正 编写 程序 求解 一 个 问题 的 过 程 
中 才 会 对 问题 本 身 理解 透彻 。 

本 书 适合 于 那些 从 未 有 过 编程 经 验 但 愿意 努力 学 习 程序 设计 的 初学 者 , 它 能 帮助 你 理解 使 用 
C++ 语言 进行 程序 设计 的 基本 原理 并 获得 实践 技巧 。 我 的 目标 是 使 你 获得 足够 多 的 知识 和 经 验 ， 
以 便 能 使 用 最 新 最 好 的 技术 进行 简单 有 用 的 编程 工作 。 达 到 这 一 目标 需要 多 长 时 间 呢 ?作为 大 
学 一 年 级 课程 的 一 部 分 , 你 可 以 在 一 个 学 期 内 完成 这 本 书 的 学 习 ( 假 定 你 有 另外 四 门 中 等 难度 的 
课程 ) 。 如 果 你 是 自学 的 话 , 不 要 期 望 能 花费 更 少 的 时 间 完 成 学 习 ( 一 般 来 说 , 每 周 15 个 小 时 , 共 
14 周 是 合适 的 学 时 安排 ) 。 

三 个 月 可 能 看 起 来 是 一 段 很 长 的 时 间 , 但 要 学 习 的 内 容 很 多 , 写 第 一 个 简单 程序 之 前 , 就 要 
花费 一 个 小 时 。 而 且 , 所 有 学 习 过 程 都 是 渐进 的 : 每 一 章 都 会 介绍 一 些 新 的 有 用 的 概念 , 并 通过 
从 实际 应 用 中 获取 的 例子 来 阐述 这 些 概念 。 随 着 学 习 进程 的 推进 , 你 通过 程序 代码 表达 思想 的 能 
力 一 一 也 就 是 让 计算 机 按 你 的 期 望 工作 的 能 力 , 会 逐渐 稳步 地 提高 。 我 从 不 会 说 :“ 先 学 习 一 个 
月 的 理论 知识 , 然后 看 看 你 是 否 能 使 用 这 些 理论 吧 。” 

为 什么 要 学 习 程 序 设计 呢 ? 因为 计算 机 文化 是 建立 在 软件 之 上 的 。 如 果 不 理解 软件 , 那么 你 
将 退化 到 只 能 相信 “魔术 ”的 境地 , 并 且 将 被 排除 在 很 多 最 为 有 趣 、 最 具 经 济 效益 和 社会 效益 的 领 
域 之 外 。 当 谈论 程序 设计 时 , 我 所 想到 的 是 整个 计算 机 程序 家 族 , ,从 带 有 GUI( 图 形 用 户 界 面 ) 的 
个 人 计算 机 程序 , 到 工程 计算 和 嵌入 式 系 统 控制 程序 (如 数码 相机 ,汽车 和 手机 中 的 程序 ), 以 及 
文字 处 理 程序 等 , 在 很 多 日 常 应 用 和 商业 应 用 中 都 能 看 到 这 些 程序 。 程 序 设计 与 数学 有 些 相 似 ， 
如 果 认 真 去 做 的 话 , 它 会 是 一 种 非常 有 用 的 智力 训练 , 可 以 锻炼 我 们 的 思考 能 力 。 然 而 , 由 于 计 
算 机 能 做 出 反馈 , 程序 设计 又 不 像 大 多 数 数学 形式 那么 抽象 ， 因 而 对 更 多 人 来 说 更 容易 接受 。 可 
以 说 , 程序 设计 是 一 条 能 够 打开 你 的 眼界 , 将 世界 变 得 更 美好 的 途径 。 最 后 , 程序 设计 非常 有 趣 。 

为 什么 学 习 C++ 这 门 程序 设计 语言 呢 ? 学 习 程 序 设 计 不 可 能 不 借助 一 门 程序 设计 语言 ， 
而 C++ 直接 支持 现实 世界 中 的 软件 所 使 用 的 那些 关键 概念 和 技术 。C++ 是 使 用 最 为 广泛 的 程 
序 设 计 语 言 之 一 , 其 应 用 领域 几乎 没有 局 限 。 从 大 洋 深 处 到 火星 表面 , 到 处 都 能 发 现 C++ 程 
序 的 身影 。C++ 是 由 一 个 开放 的 国际 标准 组 织 全 面 考 量 精心 设计 的 。 在 任何 一 种 计算 机 平台 
上 都 能 找到 高 质量 的 和 免费 的 C++ 实现。 而且, 你 用 C++ 所 学 到 的 程序 设计 思想 , 大 多 数 都 
可 直接 用 于 其 他 程序 设计 语言 , 如 C:C#、Fortran 以 及 Java。 最 后 一 个 原因 , 我 喜欢 C++ 适合 编 
写 优美 .高效 的 代码 这 一 特点 。 

本 书 不 是 初学 程序 设计 的 简单 人 门 教材 , 我 写 此 书 的 用 意 也 不 在 此 。 我 为 本 书 设 定 的 目标 
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是 :能 让 你 学 到 基本 的 实用 编程 技术 的 最 简单 的 书籍 。 这 是 一 个 雄心 勃勃 的 目标 ， 因 为 很 多 现代 
软件 所 依赖 的 技术 , 不 过 才 出 现 短 短 几 年 时 间 。 

我 的 基本 假设 是 , 你 希望 编写 供 他 人 使 用 的 程序 , 并 愿意 认真 负责 地 、 较 高 质量 地 完成 这 个 
工作 ;也 就 是 说 , 我 假定 你 希望 达到 专业 水 准 。 因 此 , 我 为 本 书 选择 的 主题 覆盖 了 开始 学 习 实 用 
编程 技术 所 需要 的 内 容 , 而 不 只 是 那些 容易 讲授 和 容易 学 习 的 内 容 。 如 果菜 种 技术 是 你 做 好 基本 
编程 工作 所 需要 的 , 那么 本 书 就 会 介绍 它 , 同时 展示 用 以 支持 这 种 技术 的 编程 思想 和 语言 工具 ， 
并 提供 相应 的 练习 , 期 望 你 通过 做 这 些 练习 来 熟悉 这 种 技术 。 但 如 果 你 只 想 了 解 “玩具 程序 ”, 那 
么 你 能 学 到 的 将 远 比 我 所 提供 的 少 得 多 。 另 一 方面 , 我 不 会 用 一 些 实用 性 很 低 的 内 容 来 浪费 你 的 
时 间 , 本 书 介绍 的 内 容 都 是 你 在 实践 中 几乎 肯定 会 用 到 的 。 

如 果 你 只 是 希望 直接 使 用 别人 编写 的 程序 ,而 不 想 了 解 其 内 部 原理 ,也 不 想 亲 自 向 代码 中 加 
入 重要 的 内 容 , 那么 本 书 不 适合 你 。 请 考虑 是 否 采 用 另 一 本 书 或 男 一 种 程序 设计 语言 会 更 好 些 。 
如 果 这 大 概 就 是 你 对 程序 设计 的 看 法 , 那么 请 同时 考虑 一 下 你 从 何 得 来 的 这 种 观点 , 它 真 的 满足 
你 的 需求 吗 ? 人 们 常常 低估 程序 设计 的 复杂 程度 和 它 的 重要 性 。 我 不 愿 看 到 你 不 喜欢 程序 设计 ， 
只 是 因为 你 的 需求 与 我 所 描述 的 部 分 软件 之 间 不 匹配 。 信 息 技术 世界 中 还 有 很 多 部 分 是 不 要 求 
程序 设计 知识 的 , 那些 领域 可 能 适合 你 。 本 书面 向 的 是 那些 确实 希望 编写 和 理解 复杂 计算 机 程序 
的 人 。 

考虑 到 本 书 的 结构 和 注重 实践 的 特点 , 它 也 可 以 作为 程序 设计 方面 的 第 二 本 书 , 适合 那些 已 
经 了 解 一 点 C++ 的 人 , 和 那些 会 用 其 他 语言 编程 , 现在 想 学 习 C++ 的 人 。 如 果 你 属于 其 中 一 类 ， 
我 不 好 估计 你 学 习 这 本 书 要 花费 多 长 时 间 。 但 我 可 以 给 你 的 建议 是 , 多 做 练习 。 因 为 你 在 学 习 中 
常见 的 一 个 问题 是 习惯 用 熟悉 的 、 旧 的 方式 编写 程序 ,而 不 是 在 适当 的 地 方 采用 新 技术 ,多 做 练 
习 会 帮助 你 解决 这 个 问题 。 如 果 你 曾经 按 某 种 更 为 传统 的 方式 学 习 过 C++ , 那么 在 进行 到 第 7 
章 之 前 , 你 会 发 现 一 些 令 你 惊奇 的 和 有 用 的 内 容 。 除 非 你 的 名 字 是 Stroustrup , 否则 你 会 发 现 我 在 
本 书 中 所 讨论 的 内 容 不 是 “你 父 非 的 C++ ”。 

学 习 程序 设计 要 靠 编程 实践 。 在 这 一 点 上 , 程序 设计 与 其 他 需要 实践 学 习 的 技能 是 相似 的 。 
你 不 可 能 仅仅 通过 读书 就 学 会 游泳 演奏 乐器 或 者 开车 , 你 必须 进行 实践 。 同 样 , 不 读 程序 、 不 写 
程序 就 不 可 能 学 会 程序 设计 。 本 书 给 出 了 大 量 代码 实例 , 都 配合 有 说 明文 字 和 图 表 。 你 需要 通过 
读 这 些 代码 来 理解 程序 设计 的 思想 、 概 念 和 原理 , 并 掌握 用 来 表达 这 些 思想 .概念 和 原理 的 程序 设 
计 语 言 的 特性 。 但 有 一 点 很 重要 , 仅仅 读 代码 是 不 能 学 会 编程 实践 技巧 的 。 为 此 ， 你 必须 进行 纺 
程 练习 , 通过 编程 工具 熟悉 编写 、 编 译 和 运行 程序 。 你 需要 亲身 体验 编程 中 会 出 现 的 错误 , 学习 
如 何 修改 它们 。 总 之 , 在 学 习 程 序 设计 的 过 程 中 , 编写 代码 的 练习 是 不 可 替代 的 。 而 且 , 这 也 是 
乐趣 所 在 ! 

另 一 方面 , 程序 设计 远 非 只 是 遵循 一 些 语法 规则 和 阅读 手册 那么 简单 。 本 书 的 重点 不 在 于 
C++ 的 语法 , 而 在 于 理解 基础 思想 、 原 理 和 技术 , 这 是 一 名 好 程序 员 所 必 备 的 。 只 有 设计 良好 的 
代码 才 有 机 会 成 为 一 个 正确 ,可靠 和 易 维护 的 系统 的 一 部 分 。 而 且 ,“ 基 础 "意味 着 延续 性 : 当 现 
在 的 程序 设计 语言 和 工具 演变 甚至 被 取代 后 , 这 些 基础 知识 仍 会 保持 其 重要 性 。 

那么 计算 机 科学 、 软 件 工程 信息 技术 等 又 如 何 呢 ? 它们 都 属于 程序 设计 范畴 吗 ? 当然 不 是 ! 
但 程序 设计 是 一 门 基础 性 的 学 科 , 是 所 有 计算 机 相关 领域 的 基础 ,在 计算 机 科学 领域 占有 重要 的 
地 位 。 本 书 对 算法 ,数据 结构 .用 户 接口 数据 处 理 和 软件 工程 等 领域 的 重要 概念 和 技术 进行 了 简 
要 介绍 。 但 本 书 不 能 取代 对 这 些 领域 全 面 均 衡 的 学 习 。 


Wl 


代码 可 以 很 有 用 , 同样 也 可 以 很 优美 。 本 书 会 帮 你 了 解 优美 的 代码 意味 着 什么 , 并 帮 你 掌握 
构造 优美 代码 的 原理 和 实践 技巧 。 祝 你 学 习 顺 利 ! 


致 学 生 


到 目前 为 止 , 我 在 德州 农工 大 学 已 经 用 本 书 的 初稿 教 过 1000 名 以 上 的 大 一 新 生 , 其 中 60% 
曾经 有 过 编程 经 历 , 而 剩余 40% 从 未 见 过 哪怕 一 行 代码 。 大 多 数学 生 的 学 习 是 成 功 的 , 所 以 你 也 
可 以 成 功 。 \ 

你 不 一 定 是 在 某 门 课程 中 来 学 习 本 书 , 我 认为 本 书 会 广泛 用 于 自学 。 然 而 , 不 管 你 学 习 本 书 
是 作为 课程 的 一 部 分 还 是 自学 , 都 要 尽量 与 他 人 协作 。 程 序 设计 有 一 个 不 好 的 名 声 一 一 它 是 一 种 
个 人 活动 , 这 是 不 公正 的 。 大 多 数 人 在 作为 一 个 有 共同 目标 的 团体 的 一 份子 时 , 工作 效果 更 好 ， 
学 习 得 更 快 。 与 朋友 一 起 学 习 和 讨论 问题 不 是 作弊 ! 而 是 取得 进步 最 有 效 , 同时 也 是 最 快乐 的 途 
径 。 如 果 没 有 特殊 情况 的 话 , 与 朋友 一 起 工作 会 促使 你 表达 出 你 的 思想 , 这 正 是 测试 你 对 问题 理 
解 和 确认 你 的 记忆 的 最 有 效 的 方法 。 你 没有 必要 独自 解决 所 有 编程 语言 和 编程 环境 中 的 难题 。 
但 是 , 请 不 要 自 菊 敬 人 , 不 去 完成 那些 简单 练习 和 大 量 的 习题 (即使 没有 老师 督促 你 , 你 也 不 应 这 
样 做 ) 。 记 住 , 程序 设计 (尤其 ) 是 一 种 实践 技能 ,需要 通过 实践 来 掌握 。 如 果 你 不 编写 代码 (完成 
每 章 的 若干 习题 ) , 那么 阅读 本 书 就 纯粹 是 一 种 无 意义 的 理论 学 习 。 

大 多 数学 生 , 特别 是 那些 爱 思 考 的 好 学 生 ， 有 时 会 对 自己 努力 工作 是 否 值得 产生 疑问 。 当 
(不 是 如 果 ) 你 产生 这 样 的 疑问 时 , 休息 一 会 儿 , 重新 阅读 这 篇 前 言 ， 阅 读 一 下 第 1 章 (“ 计 算 机 、 
人 和 程序 设计 ”) 和 第 22 章 (“ 思 想 和 历史 ”) 。 在 那里 , 我 试图 阐述 我 在 程序 设计 中 发 现 了 哪些 令 
人 兴奋 的 东西 , 以 及 为 什么 我 会 认为 程序 设计 是 能 为 世界 带 来 积极 贡献 的 重要 工具 。 如 果 你 对 我 
的 教学 理念 和 一 般 方法 有 疑问 , 请 阅读 第 0 章 (“ 致 读者 ”) 。 : 

你 可 能 会 对 本 书 的 厚度 感到 担心 。 本 书 如 此 之 厚 的 一 部 分 原因 是 , 我 宁愿 反复 重复 一 些 解释 
说 明 或 增加 一 些 实例 ,而 不 是 让 你 自己 到 处 找 这 些 内 容 , 这 应 该 令 你 安心 。 另 外 一 个 主要 原因 
是 , 本 书 的 后 半 部 分 是 一 些 参考 资料 和 补充 资料 ,， 供 你 想 要 深入 了 解 程序 设计 的 某 个 特定 领域 
(如 嵌 人 式 系统 程序 设计 、 文 本 分 析 或 数值 计算 ) 时 查阅 。 

还 有 , 学 习 中 请 耐心 些 。 学 习 任 何 一 种 重要 的 有 价值 的 新 技能 都 要 花费 一 些 时 间 , 而 这 是 
值得 的 。 


致 教师 


”本 书 不 是 一 门 传统 的 计算 机 科学 的 101 课程 ,而 是 一 本 关于 如 何 构造 能 实际 工作 的 软件 的 
书 。 因 此 本 书 省 略 了 很 多 计算 机 科学 系 学 生 按 惯例 要 学 习 的 内 容 ( 图 灵 完 全 、 状 态 机 、 高 散 数 学 、 
乔 姆 斯 基文 法 等 ) 。 硬 件 相关 的 内 容 也 省 略 了 , 因为 我 假定 学 生 从 幼儿 园 时 代 就 已 经 通过 不 同 途 
径 使 用 过 计算 机 了 。 本 书 也 不 准备 涉及 一 些 计算 机 科学 领域 最 重要 的 主题 。 本 书 是 关于 程序 设 
计 的 (或 者 更 一 般 地 , 是 关于 如 何 开发 软件 的 ) , 因此 关注 的 是 少量 主题 的 更 深入 的 细节 , 而 不 是 
像 传统 计算 机 课程 那样 讨论 很 多 主题 。 本 书 试图 只 做 好 一 件 事 ,计算 机 科学 不 是 一 门 课程 可 以 襄 
括 的 。 如 果 本 书 (本 课程 ) 被 计算 机 科学 计算 机 工程 电子 工程 (很 多 我 们 最 早 的 学 生 都 是 电子 专 
业 的 ) ,信息 科学 或 者 其 他 相关 专业 所 采用 , 我 希望 这 门 课程 能 和 其 他 一 些 课程 一 起 进行 , 共同 形 
成 对 计算 机 科学 的 完整 介绍 。 

请 阅读 第 0 章 , 那里 有 对 我 的 教学 理念 一般 教学 方法 等 的 介绍 。 请 在 教学 过 程 中 尝试 将 这 


而 
些 观点 传达 给 你 的 学 生 。 
资源 


本 书 网 站 的 网 址 为 www. stroustrup. com/Programming, 其 中 包含 了 各 种 使 用 本 书 讲授 和 学 习 程 
序 设计 所 需 的 辅助 资料 。 这 些 资 料 可 能 会 随 着 时 间 推 移 不 断 改进 , 但 对 于 初学 者 , 现在 可 以 找到 
下 面 一 些 资料 : z 

。 基于 本 书 的 讲义 的 幻灯 片 。 

。 一 本 教师 指南 。 

。 本 书 中 使 用 的 库 的 头 文件 和 实现 。 

。 本 书 中 实例 的 代码 。 

。 某 些 习题 的 解答 。 

。 可 能 有 用 的 一 些 链接 。 

。 勘误 表 。 

欢迎 随时 提出 对 这 些 资料 的 改进 意见 。 


致谢 


我 要 特别 感谢 我 已 故 的 同事 和 联合 导师 Lawrence“ Pete”Peterson, 很久 以 前 , 在 我 还 未 感受 
到 教授 初学 者 的 慨 意 时 ,是 他 鼓 励 我 承担 这 项 工作 , 并 提供 了 很 多 能 令 课程 成 功 的 教学 经 验 。 没 
有 他 , 这 门 课程 的 首次 尝试 就 会 失败 。 他 参与 了 这 门 课程 最 初 的 建设 , 本 书 就 是 为 这 门 课程 所 
著 。 他 还 和 我 一 起 反复 讲授 这 门 课程 , 汲取 经 验 , 不 断 改进 许 程 和 本 书 。 在 本 书 中 我 使 用 的 “我 
们 ”这 个 字眼 , 最 初 的 意思 就 是 指 “Pete 和 我 ”。 

我 要 感谢 那些 直接 或 间接 帮助 过 我 撰 与 本 书 的 学 生 、 助 教 以 及 德州 农工 大 学 讲授 ENGR 112 
课程 的 教师 ,以 及 Walter Daugherity ， 他 曾 讲 授 过 这 门 课程 。 还 要 感谢 Damian Dechev、 Tracy 
Hammond 、 ee Tolstrup Madsen、 Gabriel Dos Reis、 Nicholas Stroustrup、 J. C. van Winkel、 Greg 
Versoonder、Ronnie Ward 和 Leor Zolman ， 他 们 对 本 书 初稿 提出 了 一 些 建设 性 意见 。 感 谢 Mogens 
Hansen 为 我 解释 引擎 控制 软件 。 感谢 Al Aho 、Stephen Edwards、Brian Kernighan 和 Daisy Nguyen ， 
他 们 帮助 我 在 夏天 躲 开 那些 分 心 的 事 来 完成 本 书 。 

感谢 Addison-Wesley 公司 为 我 安排 的 审阅 人 : Richard Enbody、David Gustafson 、Ron McCarty 
和 KK.， Narayanaswamy ， 他 们 基于 自身 讲授 C++ 课程 或 者 大 学 计算 机 科学 系 101 课程 的 经 验 , 对 本 
书 提出 了 宝贵 的 意见 。 还 要 感谢 我 的 编辑 Peter Gordon 为 本 书 提出 的 很 多 有 价值 的 意见 以 及 他 极 
大 的 耐心 。 我 非常 感谢 Addison-Wesley 公司 为 本 书 组 织 的 制作 团队 的 同仁 , 他 们 为 本 书 的 高 质量 
出 版 做 出 了 很 多 贡献 , 他 们 是 : Julie Grady (校对 )、Chris Keane (排版 ) 、Rob Mauhar (插图 )、 
Julie Nahil ( 制作 编辑 ) 和 Barbara Wood (文字 编辑 ) 四 

另外 ， 我 本 人 对 本 书 代码 的 检查 很 不 系统 ，Bashar Anabtawi 、Yinan Fan 和 Yuriy Solodkyy 使 用 
微软 C++ 7.1 版 (2003) 和 8.0 版 (2005) 以 及 GCC 3.4.4 版 检查 了 所 有 代码 片段 。 

我 还 要 感谢 Brian Kernighan 和 Doug Mcllroy 为 程序 设计 类 书籍 的 撰写 定 下 了 非常 高 的 标准 ， 
以 及 Dennis Ritchie 和 Kristen Nygaard 为 实用 编程 语言 设计 提供 的 非常 有 价值 的 经 验 。 
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第 0 章 致 读 者 


“ 当 实 际 地 形 与 地 图 不 符 时 ,相信 实际 地 形 。” 
一 一 瑞士 军队 谚语 


本 章 汇集 了 多 种 信息 ,目的 是 使 你 对 本 书 剩余 部 分 的 内 容 有 初步 了 解 。 你 可 以 略 过 本 章 , 直接 
阅读 后 面 你 感 兴趣 的 部 分 。 对 教师 来 说 , 可 以 立即 发 现 很 多 有 用 的 内 容 。 如 果 没 有 一 个 好 的 老师 指 
导 你 学 习 本 书 , 请 不 要 试图 阅读 并 理解 本 章 的 所 有 内 容 , 只 要 阅读 “本 书 结构 "一 节 和 “讲授 和 学 习 本 书 
的 方法 "一 节 的 第 一 部 分 即 可 。 当 你 已 经 能 自如 编写 和 执行 小 程序 时 , 可 能 需要 回 过 头 来 重读 本 章 。 


0. 1 本 书 结构 


本 书 由 四 个 部 分 和 若干 个 附录 组 成 : 

。 第 一 部 分 : 基本 知识 , 介绍 了 程序 设计 的 基本 概念 和 技术 , 以 及 开始 编写 代码 需要 了 解 的 
一 些 C++ 语 言 和 库 的 知识 。 这 部 分 包括 类 型 系统 、 算 术 运 算 、 控 制 结构 、 错 误 处 理 ,以 及 
函数 和 用 户 自 定义 类 型 的 设计 、 实 现 和 使 用 等 内 容 。 

第 二 部 分 : 输入 /输出 , 介绍 了 如 何 从 键盘 和 文件 获取 数值 和 文本 数据 , 以 及 如 何 生 成 相 
应 的 输出 到 屏幕 和 文件 。 然 后 介绍 了 如 何以 图 形 化 方式 表示 数值 数据 、 文本 和 几何 图 形 ， 
以 及 如 何 从 图 形 用 户 界 面 ( graphical user interface，GUI) 获取 输入 数据 。 

第 三 部 分 : 数据 结构 和 算法 , 关注 C++ 标 准 库 中 的 容器 和 算法 框架 (标准 模板 库 , standard 
template library ，STL) 。 展 示 了 容器 ( 如 向 量 、 列 表 和 了 映射) 是 如 何 (用 指针 、 数组、 动态 内 
存 、 异 常 和 模板 ) 实 现 的 以 及 如 何 使 用 它们 。 还 展示 了 标准 库 算法 (如 排序 、 查 找 和 内 积 ) 
如 何 设 计 及 使 用 。 : 

。 第 四 部 分 : 拓宽 视野 , 通过 对 C++ 思想 和 历史 的 讨论 , 通过 一 些 实例 (如 矩阵 运算 、 文 本 
处 理 、 测试 以 及 嵌入 式 系统 程序 设计 ), 以 及 通过 C 语言 的 一 个 简单 描述 , 为 我 们 呈现 了 
程序 设计 的 一 个 全 景 。 

。 第 五 部 分 : 附录 , 提供 了 一 些 不 适合 作为 教学 但 很 有 用 的 内 容 , 如 C++ 语言 和 标准 库 的 概 
要 介绍 , 以 及 集成 开发 环境 (integrated development environment ，IDE) 和 图 形 用 户 界 面 库 
(GUI 库 ) 的 人 门 简介 等 。 

不 幸 的 是 , 现实 世界 中 的 程序 设计 并 不 能 真正 分 为 完全 独立 的 四 个 部 分 。 因 此 , 这 种 划分 仅仅 是 
对 本 书 内 容 的 一 种 粗略 分 类 。 我 们 认为 这 是 一 种 有 用 的 分 类 方法 (这 是 显然 的 ,否则 我 们 不 会 采 
用 它 ) , 但 现实 情况 往往 与 这 种 简洁 的 分 类 法 相悖 。 例 如 , 我 们 很 快 就 会 用 到 输入 操作 , 但 对 
C++ 标准 0 流 (input/output stream, 输入 /输出 流 ) 的 完整 介绍 却 出 现在 本 书 比 较 靠 后 的 部 分 。 
书 中 有 些 地 方 在 提出 某 个 概念 时 需要 先 介绍 另外 一 些 内 容 , 而 这 与 全 书 的 布局 不 符 , 对 此 , 我 们 
会 在 此 处 简明 介绍 这 些 内 容 , 以 便 更 好 地 提出 概念 , 而 不 是 仅仅 指出 这 些 内 容 的 完整 介绍 在 书 中 
什么 地 方 。 刻 板 的 分 类 法 更 适合 于 手册 而 不 是 教材 。 一 

本 书 内 容 的 顺序 是 由 程序 设计 技术 决定 的 ,而 不 是 程序 设计 语言 特性 , 参见 0.2 节 。 附 录 A 
是 按 语言 特性 组 织 的 。 


2 第 0 党 发 三 考 


0. 1. 1 一般 方法 

在 本 书 中 ,人 称 都 是 直接 的 , 简单 清楚 , 不 像 很 多 科技 论文 中 那 种 惯用 的 “专业 ”的 婉转 称呼 
方式 。 当 用 到 “你 ”时 , 我 们 的 意思 就 是 “你 、 读者”; 而 “我 们 ” 指 “ 我 们 、 作 者 和 教师 ”, 或 者 指 读 
者 和 我 们 一 起 在 讨论 某 个 问题 , 就 好 像 我 们 在 一 个 教室 中 一 样 。 

本 书 的 内 容 组 织 适合 从 头 到 尾 一 章 一 章 地 阅读 ,当然 , 你 也 常常 要 回 过 头 来 对 某 些 内 容 读 上 
第 二 遍 、 第 三 遍 。 实 际 上 , 这 是 一 种 明智 的 方法 , 因为 当 过 到 还 看 不 出 什么 门道 的 地 方 时 , 你 通 
常会 快速 探 过 。 对 于 这 种 情况 , 你 最 终 还 是 会 再 次 回 到 这 个 地 方 。 然 而 , 这 么 做 要 有 个 度 , 因为 
除了 索引 和 交叉 引用 之 外 , 对 本 书 其 他 部 分 , 你 随便 翻 开 一 页 ， 就 开始 学 习 并 希望 成 功 , 这 几乎 
是 不 可 能 的 。 本 书 每 一 节 、 每 一 章 的 内 容 安 排 , 都 假定 你 已 经 理解 了 之 前 的 内 容 。 

本 书 的 每 一 章 都 是 一 个 合理 的 自 包 含 的 单元 , 这 意味 着 应 将 其 一 口气 读 完 (当然 这 只 是 从 理 
论 上 讲 , 实际 上 由 于 学 生 紧 密 的 学 习 计 划 , 不 总 是 可 行 的 ) 。 这 是 将 内 容 划 分 为 章 的 主要 标准 。 
其 他 标准 包括 : 从 简单 练习 和 习题 的 角度 , 一 章 是 一 个 合适 的 单元 ; 每 一 章 提 出 一 些 特定 的 概念 、 
思想 或 技术 。 这 种 标准 的 多 样 性 使 得 少数 章 过 长 , 所 以 不 要 教条 地 遵循 "一 口气 读 完 ”的 准则 。 特 
别 是 当 你 已 经 考虑 了 思考 题 , 做 了 简单 练习 和 一 些 习题 时 , 通常 会 发 现 你 需要 回 过 头 去 重读 一 些 
小 节 和 几 天 前 读 过 的 内 容 。 我 们 按 主题 将 章 组 合成 “部 分 ”, 例如 , 第 二 部 分 都 是 关于 输入 /输出 
的 内 容 。 每 一 部 分 都 可 以 作为 一 个 很 好 的 完整 的 复习 单元 。 

“ 它 回答 了 我 想到 的 所 有 的 问题 "是 对 一 本 教材 常见 的 称赞 , 这 对 细节 技术 问题 是 很 理想 的 ， 
而 早期 的 读者 也 发 现 本 书 有 这 样 的 特性 。 但 是 , 这 不 是 全 部 的 理想 , 我 们 希望 提出 更 多 初学 者 可 
能 想不到 的 问题 。 我 们 的 目标 是 , 回答 那些 你 在 编写 供 他 人 使 用 的 高 质量 软件 时 需要 考虑 的 问 
题 。 学 习 回答 好 的 (通常 也 是 困难 的 ) 问题 是 学 习 如 何 像 一 个 程序 员 那 样 思考 所 必需 的 。 只 回答 
那些 简单 的 、 浅显 的 问题 会 使 你 感觉 良好 , 但 无 助 于 你 成 长 为 一 名 程序 员 。 

我 们 努力 尊重 你 的 聪明 才智, 珍惜 你 的 时 间 。 在 本 书 中 , 我 们 以 专业 性 而 不 是 精明 伶俐 为 目 
标 , 我 们 宁可 有 节制 地 表达 一 个 观点 而 不 大 肆 演 染 它 。 我 们 尽力 不 夸大 一 种 程序 设计 技术 或 一 种 
语言 特性 的 重要 性 , 但 请 不 要 因此 低估 “这 通常 是 有 用 的 ”这 种 简单 陈述 的 重要 程度 。 如 果 我 们 平 
更 地 强调 某 些 内 容 是 重要 的 , 我 们 的 意思 是 , 你 如 果 不 掌握 它 , 或 早 或 晚 都 会 因此 而 浪费 时 间 。 
我 们 喜欢 幽默 , 但 在 本 书 中 使 用 很 谨慎 。 经 验 表 明 ， 人 们 对 什么 是 幽 软 的 看 法 大 相 径 庭 , 不 恰当 
地 使 用 幽 黑 会 把 人 弄 糊涂 。 

我 们 不 会 伪 称 本 书 中 的 思想 和 工具 是 完美 的 。 实 际 上 没有 任何 一 种 工具 、 库 、 语言 或 者 技术 
能 够 解决 程序 员 所 面临 的 所 有 难题 ， 至 多 能 帮助 你 开发 、 表 达 你 的 问题 求解 方案 而 已 。 我 们 尽量 
避免 “无 恶意 的 谎言 ” ,也 就 是 说 ,对 于 那些 清晰 易 理 解 , 但 在 实际 编程 和 问题 求解 时 容易 弄 错 的 
内 容 , 对 其 介绍 避免 过 度 简 单 化 。 另 一 方面 , 本 书 不 是 一 本 参考 手册 ; 如 果 需 要 C++ 详细 完整 的 
描述 , 请 参考 Bjame Stroustrup 的 《The C ++ Programming Language( Special Edition )》9 一 书 (Addi- 
son-Wesley 出 版 社 , 2000 年 ) 和 ISO 的 C++ 标准 。 

0. 1.2 简单 练习 、 习 题 等 
程序 设计 不 仅 是 一 种 脑力 活动 ,实际 动手 编写 程序 是 掌握 程序 设计 技巧 必 不 可 少 的 一 个 环 
节 。 本 书 提供 以 下 两 个 层次 的 程序 设计 练习 : 


© 本 书 中 文 版 已 由 机 械 工 业 出 版 社 引进 出 版 , 书 名 为 《C++ 程序 设计 语言 (特别 版 )》。 一 一 编辑 注 


锣 0 莫 和谈 者 3 


e 简单 练习 : 简单 练习 是 一 种 非常 简单 的 习题 ， 其 目的 是 帮助 学 生 和 掌握 一 些 机 械 的 实际 编程 
技巧 。 一 个 简单 练习 通常 由 对 单个 程序 的 一 系列 修改 练习 组 成 。 你 应 该 完成 所 有 简单 练 
习 。 完 成 简单 练习 不 需要 很 强 的 理解 能 力 、 很 聪明 或 者 很 有 创造 性 。 简 单 练习 是 本 书 的 
基本 组 成 部 分 , 如 果 你 没有 完成 简单 练习 , 就 不 能 说 完成 了 本 书 的 学 习 。 

习题 : 有 些 习题 比较 简单 而 有 些 则 很 难 , 但 大 多 数 习题 都 是 想 给 学 生 留 下 一 定 的 创造 和 想 
象 的 空间 。 如 果 时 间 紧 张 , 你 可 以 做 少量 习题 。 但 至 少 应 该 弄 清楚 哪些 内 容 对 你 来 说 比 
较 困难 , 在 此 基础 上 应 该 再 多 做 一 些 , 这 才 是 学 习 成 功 之 道 。 我 们 希望 本 书 的 习题 都 是 学 
生 能 够 做 出 来 的 ， 而 不 是 需要 超 乎 常人 的 智力 才能 解答 的 复杂 难题 。 但 是 , 我 们 还 是 期 户 
本 书 习 题 能 给 你 足够 多 的 挑战 ， 能 用 光 甚 至 是 最 好 的 学 生 的 所 有 时 间 。 我 们 不 期 竺 你 能 
完成 所 有 习题 , 但 请 尽情 尝试 。 

男 外 , 我 建议 每 个 学 生 都 能 参与 到 一 个 小 的 项 目 中 去 (如 果 时 间 人 允许 , 能 参与 更 多 项 目 当 然 就 更 
好 了 ) 。 一 个 项 目 就 是 要 编写 一 个 完整 的 有 用 的 程序 。 理 想 情 况 , 一 个 项 目 由 一 个 多 人 小 组 ( 比如 
三 个 人 ) 共 同 完成 , 最 好 在 学 习 第 三 部 分 的 同时 花 大 概 一 个 月 时 间 来 完成 整个 项 目 。 大 多 数 人 会 
发 现 做 项 目 非常 有 趣 , 并 在 这 个 过 程 中 学 会 如 何 把 很 多 事情 组 织 在 一 起 。 

一 些 人 喜欢 在 读 完 一 章 之 前 就 把 书 扔 到 一 边 , 开始 尝试 做 一 些 实例 程序 ; 另 一 些 人 则 喜欢 把 
一 章 读 完 后 ,再 开始 编码 。 为 了 帮助 前 一 种 读者 , 我 们 在 正文 的 段落 之 间 放 置 了 一 些 有 “ 试 一 试 ” 
标识 的 文字 , 给 出 了 对 于 编程 实践 的 一 些 简单 建议 。“ 试 一 试 ” 本 质 上 来 说 就 是 一 个 简单 练习 , 而 
且 只 着 眼 于 前 面 刚 刚 介绍 的 主题 。 如 果 你 略 去 一 个 “ 试 一 试 "而 没有 去 尝试 它 ( 也 许 因为 你 的 手边 
没有 计算 机 ,或 者 你 过 于 沉浸 在 正文 的 内 容 中 ), 那么 最 好 在 做 这 一 章 的 简单 练习 时 做 一 下 这 个 题 
目 。“ 试 一 试 " 要 么 是 该 章 简 单 练习 的 补充 , 要 么 干脆 就 是 其 中 一 部 分 。 

在 每 章 末尾 你 都 会 看 到 一 些 思 考题 ,我 们 设置 这 些 思考 题 是 想 为 你 指出 这 一 章 中 的 重点 内 
容 。 一 种 学 习 思 考题 的 方法 是 把 它们 作为 习题 的 补充 : 习题 关注 程序 设计 的 实践 层面 ,而 思考 题 
则 试图 帮 你 强化 思想 和 概念 。 因 此 , 思考 题 有 点 像 面 试题 。 

每 章 最 后 都 有 “术语 "一 节 , 给 出 本 章 中 提出 的 程序 设计 或 C++ 方面 的 主要 词汇 表 。 如 果 你 
希望 理解 别人 关于 程序 设计 的 陈述 ， 或 者 想 明 确 表 达 出 你 自己 的 思想 ， 就 应 该 首先 弄 清 术语 表 中 
每 个 术语 的 含义 。 

重复 是 学 习 的 有 效 手段 , 我 们 希望 每 个 重要 的 知识 点 都 在 书 中 至 少 出 现 两 次 , 并 通过 习题 再 
次 强调 。 

0. 1.3 进 阶 学 习 

当 你 完成 本 书 的 学 习 时 , 是 否 能 成 为 一 名 程序 设计 和 C++ 方面 的 专家 呢 ? 答案 当然 是 否定 
的 ! 如 果 做 得 好 的 话 , 程序 设计 会 是 一 门 建立 在 多 种 专业 技能 上 的 精妙 的 、 深 刻 的 、 需 要 高 度 技 
巧 的 艺术 。 你 不 能 奢望 花 四 个 月 时 间 就 成 为 一 名 程序 设计 专家 ， 就 像 你 不 能 奢望 花 四 个 月 、 半 年 
或 一 年 时 间 就 成 为 一 名 生物 学 专家 、 数 学 家 、 自 然 语 言 ( 如 中 文 、 英 文 或 丹麦 文 ) 方 面 的 专家 或 者 
小 提琴 演奏 家 一 样 。 如 果 你 认真 地 学 完了 这 本 书 , 你 可 以 期 待 , 也 应 该 期 待 的 是 : 你 已 经 在 程序 
设计 领域 有 了 一 个 很 好 的 开始 , 已 经 可 以 写 相 对 简单 的 、 有 用 的 程序 , 能 读 更 复杂 的 程序 , 而 且 
已 经 为 进一步 的 学 习 打下 了 良好 的 理论 和 实践 基础 。 z 

学 习 完 这 门人 门 课 程 后 , 最 好 的 进一步 学 习 的 方法 是 开发 一 个 真正 能 被 别人 使 用 的 程序 。 在 
完成 这 个 项 目 这 之 后 , 或 者 同时 (同时 可 能 更 好 ), 学 习 一 本 专业 水 平 的 教材 (如 Stroustrup 的 《The 
C++ Programming Language》), 学 习 一 本 与 你 做 的 项 目 相 关 的 更 专业 的 书 (例如 , 你 如 果 在 做 GUI 
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相关 项 目的 话 , 可 选择 关于 Qt 的 书 ; 如 果 在 做 分 布 式 程序 的 话 ， 可 选择 关于 ACE 的 书 ), 或 者 学 
习 一 本 专注 于 C++ 某 个 特定 方面 的 书 ( 如 Koenig 和 Moo 的 《 Accelerated C++ 》2 ，Sutter 的 《Excep- 
tional C++ 》 或 Gamma 等 人 的 《Design Pattems》 ) 。 完 整 的 参考 书目 , 参见 0.6 节 或 本 书 最 后 的 
“参考 书目 "一 节 。 

最 后 , 你 应 该 学 习 另 一 门 程序 设计 语言 。 我 们 认为 ， 如 果 只 懂 一 门 语言 , 你 是 不 可 能 成 为 软 
件 领 域 的 专家 的 (即使 你 并 不 想 做 一 名 程序 员 ) 。 


0. 2 讲授 和 学 习 本 书 的 方法 


”我 们 是 如 何 帮 助 你 学 习 的 ? 又 是 如 何 安排 学 习 进 程 的 ? 我 们 的 做 法 是 , 尽力 为 你 提供 编写 高 
效 的 实用 程序 所 需 的 最 基本 的 概念 、 技 术 和 工具 , 包括 : 

e 程序 组 织 

e 调试 和 测试 

。 类 设计 

。 计算 

e 函数 和 算法 设计 

e 绘图 方法 ( 仅 介 绍 二 维 图 形 ) 

e 图 形 用 户 界面 (CUD) 

e 文本 处 理 

e 正则 表达 式 匹 配 

。 文件 和 流 输入 /输出 (IO) 

。 内 存 管理 

。 科 学 /数值 /工程 计算 

e 设计 和 编程 思想 

e C++ 标准 库 

e 软件 开发 策略 

e C 语言 程序 设计 技术 
认真 完成 这 些 内 容 的 学 习 , 我 们 会 学 到 如 下 程序 设计 技术 : 过 程式 程序 设计 (C 语言 程序 设计 风 
格 )、 数 据 抽象 、 面 向 对 象 程序 设计 和 泛 型 程序 设计 。 本 书 的 主题 是 程序 设计 , 也 就 是 表达 代码 意 
图 所 需 的 思想 、 技术 和 工具 。C++ 语 言 是 我 们 的 主要 工具 , 因此 我 们 比较 详细 地 描述 了 很 多 C ++ 
语言 的 特性 。 但 请 记 住 , C++ 只 是 一 种 工具 ， 而 不 是 本 书 的 主题 。 本 书 主题 是 “用 C++ 语言 进行 
程序 设计 ”而 不 是 “C++ 和 一 点 程序 设计 理论 ”。 

我 们 介绍 的 每 个 主题 都 至 少 服务 于 两 个 目的 : 提出 一 种 技术 、 概 念 或 原理 , 介绍 一 种 实用 的 
语言 特性 或 库 特性 。 例 如 , 我 们 用 一 个 二 维 图 形 绘 制 系 统 的 接口 展示 如 何 使 用 类 和 继承 。 这 使 我 
们 节省 了 篇 旺 ( 也 节省 了 你 的 时 间 ), 并 且 还 强调 了 程序 设计 不 只 是 简单 地 将 代码 拼装 起 来 以 尽快 
地 得 到 一 个 结果 。C++ 标 准 库 是 这 种 “双重 作用 ”例子 的 主要 来 源 ， 其 中 很 多 主题 甚至 具有 三 重 
作用 。 例 如 , 我 们 会 介绍 标准 库 中 的 向 量 类 vector, 用 它 来 展示 一 些 广泛 使 用 的 设计 技术 , 并 展示 


@ 本 书 英文 影印 版 和 中 文 版 均 已 由 机 械 工 业 出 版 社 引 进出 版 。 一 一 编辑 注 
外 本 书 英文 影印 版 已 由 机 械 工业 出 版 社 引进 出 版 。 一 一 编辑 注 
入 本 书 中 文 版 已 由 机 械 工业 出 版 社 引 进出 版 , 书 名 为 《设计 模式 》。 一 一 编辑 注 
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很 多 用 来 实现 vector 的 程序 设计 技术 。 我 们 的 一 个 目标 是 向 你 展示 一 些 主要 的 标准 库 功能 是 如 何 
实现 的 , 以 及 它们 如 何 与 硬件 相配 合 。 我 们 坚持 认为 一 个 工匠 必须 了 解 他 的 工具 , 而 不 是 仅仅 把 
工具 当做 “有 魔力 的 东西 ”。 

对 于 程序 员 来 说 , 总 是 会 对 某 些 主题 比 其 他 主题 更 感 兴趣 。 但 是 , 我 们 建议 你 不 要 预先 判断 
你 需要 什么 (你 怎么 知道 你 将 来 会 需要 什么 呢 ) , 至 少 每 一 章 都 要 浏览 一 下 。 如 果 你 学 习 本 书 是 作 
为 一 门 课程 的 一 部 分 , 你 的 老师 会 指导 你 如 何 选择 学 习 内 容 。 

我 们 的 教学 方法 可 以 描述 为 “深度 优先 ”, 也 可 以 描述 为 “具体 优先 "和 * 基 于 概念 ”。 首 先 ， 
我 们 快速 地 (好 吧 , 是 相对 快速 的 , 从 第 1 章 到 第 11 章 ) 将 一 些 编写 小 的 实用 程序 所 需 的 技巧 提 
供给 你 。 在 这 期 间 , 我 们 还 简明 扼要 地 提出 很 多 工具 和 技术 。 我 们 着 重 介绍 简单 具体 的 代码 实 
例 , 因为 相对 于 抽象 概念 ， 人 们 能 更 快 地 领会 具体 实例 , 这 是 大 多 数 人 的 学 习 方 法 。 在 最 初 阶段 ， 
你 不 应 期 望 理解 每 个 小 的 细节 。 特 别 是 你 会 发 现 , 对 刚刚 还 工作 得 好 好 的 程序 只 是 稍 加 改动 , 便 
会 呈现 出 “神秘 ”的 效果 。 尽 管 如 此 , 你 还 是 要 尝试 一 下 ! 还 有 , 请 完成 我 们 提供 的 简单 练习 和 习 
题 。 请 记 住 , 在 学 习 初 期 你 只 是 没有 掌握 足够 的 概念 和 技巧 来 准确 判断 什么 是 简单 的 , 什么 是 复 
杂 的 ; 请 等 待 一 些 惊奇 的 事情 发 生 , 并 从 中 学 习 吧 。 

我 们 会 快速 通过 这 样 一 个 初始 阶段 一 一 我 们 想 尽 可 能 快 地 带 你 进入 编写 有 趣 程序 的 阶段 。 
有 些 人 可 能 会 质疑 ,，“ 我 们 的 进展 应 该 慢 些 、 谨 慎 些 , 我 们 应 该 先 学 会 走 , 再 学 跑 !” 但 是 你 见 过 小 
孩儿 学 习 走 路 吗 ? 小 孩儿 确实 是 在 学 会 平稳 地 慢 慢 走路 之 前 就 开始 自己 学 着 跑 了 。 与 之 相似 , 你 
可 以 先 勇猛 向 前 , 偶尔 摔 一 跤 , 从 中 获得 编程 的 感觉 , 然后 再 慢 下 来 , 获得 必要 的 精确 控制 能 力 
和 准确 的 理解 。 你 必须 在 学 会 走 之 前 就 开始 跑 ! | 

你 不 要 投入 大 量 精 力 试图 学 习 一 些 语言 或 技术 细节 的 所 有 相关 内 容 。 例 如 , 你 可 以 熟 记 所 有 
C++ 的 内 置 类 型 及 其 使 用 规则 。 你 当然 可 以 这 么 做 , 而 且 这 么 做 会 使 你 觉得 自己 很 博学 。 但 是 ， 
这 不 会 使 你 成 为 一 名 程序 员 。 如 果 你 学 习 中 略 过 一 些 细节 , 将 来 可 能 偶尔 会 因为 缺少 相关 知识 而 
被 “灼伤 ”, 但 这 是 获取 编写 好 程序 所 需 的 完整 知识 结构 的 最 快 途径 。 注 意 , 我 们 的 这 种 方法 本 质 
上 就 是 小 孩儿 学 习 母 语 的 方法 ,也 是 教授 外 语 的 最 有 效 的 方法 。 有 时 你 不 可 避免 地 被 难题 困 住 ， 
我 们 鼓励 你 向 授课 老师 、 朋 友 、 同 事 、 辅 导 员 以 及 导师 等 寻求 帮助 。 请 放心 , 在 前 面 这 些 章节 中 ， 
所 有 内 容 本 质 上 都 不 困难 。 但 是 , 很 多 内 容 是 你 所 不 熟悉 的 , 因此 最 初 可 能 会 感觉 有 点 难 。 

随后 , 我 们 向 你 介绍 一 些 和 人 门 技巧 , 来 拓宽 你 的 知识 和 技巧 基础 。 你 通过 实例 和 习题 来 强化 
理解 , 我 们 为 你 提供 一 个 程序 设计 的 概念 基础 。 

我 们 重点 强调 思想 和 原理 。 思 想 能 指导 你 求解 实际 问题 一 一 可 以 帮助 你 知道 在 什么 情况 下 
问题 求解 方案 是 好 的 、 合 理 的 。 你 还 应 该 理解 这 些 思想 背后 的 原理 ,从 而 理解 为 什么 要 接受 这 些 
思想 ,为 什么 遵循 这 些 思想 会 对 你 和 使 用 你 的 代码 的 用 户 有 帮助 。 没 有 人 会 满意 “因为 事情 就 是 
这 样 的 ”这 种 解释 。 更 为 重要 的 是 , 如 果真 正 理解 了 思想 和 原理 , 你 就 能 将 已 有 的 知识 推广 到 新 
的 情况 , 就 能 用 新 的 方法 将 思想 和 工具 结合 来 解决 新 的 问题 。 知 其 所 以 然 是 学 会 程序 设计 技巧 所 
必需 的 。 相 反 , 仅仅 不 求 甚 解 地 记 住 大 量规 则 和 语言 特性 有 很 大 局 限 , 是 错误 之 源 , 也 是 在 浪费 
时 间 。 我 们 认为 你 的 时 间 很 珍贵 , 尽力 不 浪费 它 。 

我 们 把 很 多 C++ 语言 层面 的 技术 细节 放 在 了 附录 和 手册 中 , 你 可 以 随时 按 需 查找 。 我 们 假 
定 你 有 能 力 查找 到 你 需要 的 信息 , 你 可 以 借助 索引 和 目录 来 查找 信息 。 不 要 忘 了 编译 器 和 互联 网 
也 有 在 线 帮助 功能 。 但 要 记 住 , 要 对 所 有 互联 网 资源 保持 足够 高 的 怀疑 ， 直至 你 有 足够 的 理由 相 
言 它 们 。 因 为 很 多 看 起 来 很 权威 的 网 站 实际 上 是 由 程序 设计 新 手 或 者 想 要 出 售 什么 东西 的 人 建 
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立 的 。 而 另外 一 些 网 站 , 其 内 容 都 是 过 时 的 。 我 们 在 支持 网 站 www. stroustrup. com/Programming 上 
列 出 了 一 些 有 用 的 网 站 链接 和 信息 。 

请 不 要 过 于 急切 地 期 盼 “实际 的 ”例子 。 我 们 理想 的 实例 都 是 能 直接 说 明 一 种 语言 特性 、 一 个 概 
念 或 者 一 种 技术 的 简短 的 代码 。 很 多 现实 世界 中 的 实例 比 我 们 给 出 的 实例 要 凌乱 很 多 , 而 且 所 能 展 
示 的 知识 也 不 如 我 们 的 实例 更 多 。 数 十 万 行规 模 的 成 功 的 商业 程序 中 所 采用 的 技术 , 我 们 用 几 个 50 
行规 模 的 程序 就 能 展示 出 来 。 最 快 的 理解 现实 世界 程序 的 途径 是 好 好 研究 一 些 基 础 的 小 程序 。 

另 一 方面 , 我 们 不 会 用 “cute 风格 "来 阐述 我 们 的 观点 。 我 们 假定 你 的 目标 是 编写 供 他 人 使 用 
的 实用 程序 , 因此 书 中 给 出 的 实例 要 么 是 用 来 说 明 语 言 特性 ,要 么 是 从 实际 应 用 中 提取 出 来 的 。 
我 们 的 令 述 风格 都 是 用 专业 人 员 对 (将 来 的 ) 专 业 人 员 的 那 种 口气 。 

0.2.1 本 书 内 容 顺 序 的 安排 

讲授 程序 设计 有 很 多 方法 。 很 明显 , 我 们 不 赞同 “我 学 习 程 序 设计 的 方法 就 是 最 好 的 学 习 方 
法 ”这 种 流行 的 看 法 。 为 了 方便 学 习 , 我 们 较 早 地 提出 一 些 仅仅 几 年 前 还 是 先进 技术 的 内 容 。 我 
们 的 设想 是 , 本 书 内 容 的 顺序 完全 由 你 学 习 程序 设计 过 程 中 遇 到 的 问题 来 决定 ， 随 着 你 对 程序 设 
计 的 理解 和 实际 动手 能 力 的 提高 , 一 个 主题 一 个 主题 地 平滑 向 前 推进 。 本 书 的 叙述 顺序 更 像 一 部 
小 说 ， 而 不 是 一 部 字典 或 者 一 种 层次 化 的 顺序 。 

一 次 性 地 学 习 所 有 程序 设计 原理 、 技 术 和 语言 功能 是 不 可 能 的 。 因 此 , 你 需要 选择 其 中 一 个 
子 集 作为 起 点 。 更 一 般 地 , 一 本 教材 或 一 门 课程 应 该 通过 一 系列 的 主题 子 集 来 引导 学 生 。 我 们 认 
为 选择 适当 的 主题 并 给 出 重点 是 我 们 的 责任 。 我 们 不 能 简单 地 罗列 出 所 有 内 容 ,， 必须 做 出 取舍; 
在 每 个 学 习 阶 段 , 我 们 选择 省 略 内 容 与 选择 保留 内 容 至 少 同样 重要 。 

作为 对 照 , 这 里 列 出 我 们 决定 不 采用 的 教学 方法 (仅仅 是 一 个 缩 略 列表 ) ， 可 能 对 你 有 用 : 

eC 优先: 用 这 种 方法 学 习 C++. 完 全 是 浪费 学 生 的 时 间 , 学 生 能 用 来 求解 问题 的 语言 功能 、 
技术 和 库 比 所 需 的 要 少 得 多 , 这 样 的 编程 实践 很 糟糕 。 与 C 相 比 ，C ++ 能 提供 更 强 的 类 
型 检查 ,对 新 手 来 说 更 好 的 标准 库 , 以 及 用 于 错误 处 理 的 异常 机 制 。 

自 底 向 上 : 学 生 本 该 学 习 好 的 、 有 效 的 程序 设计 技巧 , 但 这 种 方法 分 散 了 学 生 的 注意 力 。 
学 生 在 求解 问题 过 程 中 所 能 依靠 的 编程 语言 和 库 方面 的 支持 明显 不 足 , 这 样 的 编程 实践 
质量 很 低 、 训 无 用 处 。 

如 果 你 介绍 某 些 内 容 , 就 必须 介绍 它 的 全 部 : 这 实际 上 意味 着 自 底 向 上 方法 (一 头 扎 进 涉及 
的 每 个 主题 , 越 陷 越 深 ) 。 这 种 方法 硬 塞 给 初学 者 很 多 他 们 并 不 感 兴趣 , 而 且 可 能 很 长 时 间 
内 都 用 不 上 的 技术 细节 , 令 他 们 厌烦 。 这 样 做 豪 无 必要 ， 因 为 一 旦 学 会 了 编程 , 你 完全 可 以 
自己 到 手册 中 查找 技术 细节 。 这 是 手册 适合 的 用 途 , 如 果 用 来 学 习 基 本 概念 就 太 可 怕 了 。 
自 顶 向 下 : 这 种 方法 , 对 一 个 主题 从 基本 原理 到 细节 逐步 介绍 , 倾向 于 把 读者 的 注意 力 从 
程序 设计 的 实践 层面 上 转移 开 , 迫使 读者 一 直 专 注 于 上 层 概 念 ， 而 没有 任何 机 会 实际 体会 
这 些 概 念 的 重要 性 。 例 如 ,如 果 你 没有 实际 体验 编写 程序 是 那么 容易 出 错 , 而 修正 一 个 错 
误 是 那么 困难 , 你 就 无 法 体会 到 正确 的 软件 开发 原理 。 

抽象 优先 : 这 种 方法 专注 于 一 般 原理 , 保护 学 生 不 受 讨厌 的 现实 问题 限制 条 件 的 困扰 ,这 
会 导致 学 生 轻 视 实际 问题 、 语 言 、 工 具 和 硬件 限制 。 通 常 , 这 种 方法 基于 “教学 用 语 
言 " 一 一 一 种 将 来 不 可 能 实际 应 用 , 有意 将 学 生 与 实际 的 硬件 和 系统 问题 隔绝 开 的 语言 。 
e 软件 工程 理论 优先 : 这 种 方法 和 抽象 优先 的 方法 具有 与 自 顶 向 下 方法 一 样 的 缺点 : 没有 具 
体 实 例 和 实践 体验 , 你 无 法 体会 到 抽象 理论 的 价值 和 正确 的 软件 开发 实践 技巧 。 


e 面向 对 象 先 行 : 面向 对 象 程序 设计 是 组 织 代码 和 开发 工作 的 最 好 方法 , 但 并 不 是 唯一 有 效 
的 方法 。 特 别 是 ,以 我 们 的 体会 , 在 类 型 系统 和 算法 式 编程 方面 打下 良好 的 基础 ,是 学 习 
类 和 类 层次 设计 的 前 提 条 件 。 本 书 确实 在 一 开始 就 使 用 了 用 户 自 定义 类 型 (一 些 人 称 之 为 
“对 象 " ) , 但 我 们 直到 第 6 章 才 介绍 如 何 设计 一 个 类 , 而 直到 第 12 章 才 介绍 类 层次 。 
e “相信 魔法 ": 这 种 方法 只 是 向 初学 者 展示 强 有 力 的 工具 和 技术 , 但 不 介绍 其 下 蕴含 的 技 
术 和 功能 。 这 让 学 生 只 能 去 猜 这 些 工 具 和 技术 为 什么 会 有 这 样 的 表现 ,使 用 它们 会 付出 
多 大 代价 , 以 及 它们 合理 的 应 用 范围 , 通常 学 生 会 猜 错 ! 这 会 导致 学 生 过 分 刻板 地 遵循 相 
似 的 工作 模式 , 成 为 进一步 学 习 的 障碍 。 
目 然 , 我 们 不 会 断言 这 些 我 们 没有 采用 的 方法 毫 无 用 处 。 实 际 上 , 在 介绍 一 些 特定 的 内 容 
时 , 我 们 使 用 了 其 中 一 些 方法 , 学 生 能 体会 到 这 些 方法 在 一 些 特殊 情况 下 的 优点 。 但 是 ， 当 学 习 
程序 设计 是 以 实用 为 目标 时 , 我 们 不 把 一 些 方 法 作为 一 般 的 教学 方法 , 而 是 采用 其 他 方法 : 主要 
是 具体 优先 和 深度 优先 方法 , 并 对 重点 概念 和 技术 加 以 强调 。 
0.2.2 程序 设计 和 程序 设计 语言 

我 们 首先 介绍 程序 设计 , 把 程序 设计 语言 作为 一 种 工具 放 在 第 二 位 。 我 们 介绍 的 程序 设计 方 
法 适用 于 任何 通用 的 程序 设计 语言 。 我 们 的 首要 目的 是 帮助 你 学 习 一 般 概念 、 原 理 和 技术 , 但 是 
不 能 孤立 地 学 习 这 些 内 容 。 例 如 , 不 同 程序 设计 语言 在 语法 细节 、 编 程 想法 的 表达 以 及 工具 等 方 
面 各 不 相同 。 但 对 于 编写 无 错 代码 的 很 多 基本 技术 ,如 编写 逻辑 简单 的 代码 (参见 第 5 章 和 第 6 
章 ) , 构造 不 变 式 ( 人 参见 9.4.3 节 ),， 以 及 接口 和 实现 细节 分 离 (参见 9.7 节 和 14.1 节 ~14.2 节 ) 
等 , 不 同 程序 设计 语言 则 差别 很 小 。 

程序 设计 技术 的 学 习 必 须 借 助 于 一 门 程序 设计 语言 , 设计 、 组 织 代 码 和 调试 等 技巧 是 不 可 能 
从 抽象 理论 中 学 到 的 。 你 必须 用 某 种 程序 设计 语言 编写 代码 ， 从 中 获取 实践 经 验 。 这 意味 着 你 必 
须 学 习 一 门 程序 设计 语言 的 基本 知识 。 这 里 说 “基本 知识 "是 因为 , 花 几 个 星期 就 能 掌握 一 门 主流 
实用 编程 语言 全 部 内 容 的 日 子 已 经 一 去 不 复 返 了 。 本 书 讲述 的 与 C++ 语 言 相关 的 内 容 只 是 它 的 
一 个 子 集 , 即 与 编写 高 质量 代码 关系 最 紧密 的 那 部 分 内 容 。 而 且 , 我 们 所 介绍 的 C++ 特性 都 是 你 
肯定 会 用 到 的 , 因为 这 些 特性 要 么 是 出 于 逻辑 完整 性 的 要 求 , 要 么 是 C++ 社区 中 最 常见 的 。 
0.2.3 可 移植 性 

编写 运行 于 多 种 平台 的 C++ 程序 是 很 常见 的 情况 。 一 些 重 要 的 C++ 应 用 甚至 运行 于 我 们 闻 
所 未 闻 的 平台 上 ! 我 们 认为 可 移植 性 和 对 多 种 平台 架构 和 操作 系统 的 利用 是 非常 重要 的 特性 。 
本 质 上 , 本 书 的 每 个 例子 不 仅 是 ISO 标准 C++ 程 序 , 而 且 是 可 移植 的 。 除 非特 别 指出 , 本 书 的 代 
码 都 能 运行 于 任何 一 种 C++ 实现 , 并 且 确 实 已 经 在 多 种 计算 机 平台 和 操作 系统 上 测试 通过 了 。 

不 同系 统 编译 、 连 接 和 运行 C++ 程序 的 细节 各 不 相同 , 如 果 每 当 提 及 一 个 实现 问题 时 ， 就 介 
绍 所 有 系统 和 所 有 编译 器 的 细节 , 是 非常 单调 乏味 的 。 我 们 在 附录 C 中 给 出 了 Windows 平台 
Visual Studio 和 Microsoft C++ 人 门 的 大 部 分 基本 知识 。 

如 果 你 在 使 用 任何 一 种 流行 的 , 但 相对 复杂 的 IDE(integrated development environment, 集成 开 
发 环境 ) 时 遇 到 了 困难 , 我 们 建议 你 尝试 命令 行 工作 方式 , 它 极其 简单 。 例 如 ,下面 给 出 的 是 用 
GNU C++ 编译 器 , 在 UNIX 或 Linux 系统 中 编译 、 连 接 和 执行 一 个 包含 两 个 源 文件 my_filel. cpp 


和 my_file2. cpp 的 简单 程序 所 需 的 全 部 命令 ; 


B++ -0 my_program my _filel.cpp my_file2.cpp 
my_program 


是 的 , 这 真 的 就 是 全 部 。 


“8 采 0 间 至 放大 


0. 3“ 程序 设计 和 计算 机 科学 


程序 设计 就 是 计算 机 科学 的 全 部 吗 ? 答案 当然 是 否定 的 ! 我 们 提出 这 一 问题 的 唯一 原因 就 
是 确实 兽 有 人 将 其 混淆 。 本 书 会 简单 涉及 计算 机 科学 的 一 些 主题 ， 如 算法 和 数据 结构 , 但 我 们 的 
目标 还 是 讲授 程序 设计 : 设计 和 实现 程序 。 这 比 广 泛 接受 的 计算 机 科学 的 概念 更 宽 , 但 也 更 罕 : 

。 更 宽 , 因为 程序 设计 包含 很 多 专业 技巧 , 通常 不 能 归 类 于 任何 一 种 科学 。 

。 更 窄 , 因为 就 我 们 涉及 的 计算 机 科学 的 内 容 而 言 , 我 们 没有 系统 地 给 出 其 基础 。 

本 书 的 目标 是 作为 一 门 计算 机 科学 课程 的 一 部 分 (如 果 成 为 一 个 计算 机 科学 家 是 你 的 目标 的 
话 ), 作为 软件 构造 和 维护 领域 第 一 门 基础 课程 (如 果 你 希望 成 为 一 个 程序 员 或 者 软件 工程 师 的 
话 ), 总 之 是 更 大 的 完整 系统 的 一 部 分 。 

本 书 自始至终 都 依赖 计算 机 科学 , 我 们 也 强调 基本 原理 , 但 我 们 是 以 理论 和 经 验 为 基础 来 讲 
授 程序 设计 , 是 把 它 作 为 一 种 实践 技能 ,而 不 是 一 门 科 学 。 


0.4 创造 性 和 问题 求解 


本 书 的 首要 目标 是 帮助 你 学 会 用 代码 表达 你 的 思想 , 而 不 是 教 你 如 何 获 得 这 些 思想 。 沿 着 这 
样 一 个 思路 , 我 们 给 出 很 多 实例 , 展示 如 何 求 解 问题 。 每 个 实例 通常 先 分 析 问 题 , 随后 对 求解 方 
案 逐 步 求 精 。 我 们 认为 程序 设计 本 身 是 问题 求解 的 一 种 描述 形式 : 只 有 完全 理解 了 一 个 问题 及 其 
求解 方案 , 你 才能 用 程序 来 正确 表达 它 ; 而 只 有 通过 构造 和 测试 一 个 程序 , 你 才能 确定 你 对 问题 
和 求解 方案 的 理解 是 完整 的 、 正 确 的 。 因 此 , 程序 设计 本 质 上 是 理解 问题 和 求解 方案 工作 的 一 部 
分 。 但 是 , 我 们 的 目标 是 通过 实例 来 说 明 这 一 切 , 而 不 是 通过 “布道 ”或 是 对 问题 求解 详细 “处 方 ” 
的 描述 。 


0.5 反馈 方法 


我 们 认为 不 存在 完美 的 教材 , 个 人 的 需求 总 是 差别 很 大 的 。 但 是 , 我 们 愿意 尽力 使 本 书 和 支 
持 材料 更 接近 完美 。 为 此 , 我 们 需要 大 家 的 反馈 ,脱离 读者 是 不 可 能 写 出 好 教材 的 。 请 大 家 给 我 
们 发 送 反馈 报告 , 包括 内 容错 误 、 排 版 错误 、 含混 的 文字 、 缺失 的 解释 等 。 我 们 也 欢迎 有 关 更 好 
的 习题 、 更 好 的 实例 、 增 加 内 容 、 删除 内 容 等 建议 。 大 家 提出 的 建设 性 的 意见 会 帮助 将 来 的 读者 ， 
我 们 会 将 勘误 表 张 贴 在 支持 网 站 上 :www. stroustrup. com/ Programming。 


0.6 参考 文献 
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更 全 面 的 参考 文献 列表 可 以 在 本 书 最 后 “参考 书目 ”一 节 找到 。 
0.7 作者 简介 


你 也 许 有 理由 问 :“ 是 一 些 什么 人 想 要 教 我 程序 设计 ?”" 那 么 , 下 面 是 作者 简介 。 我 ( 即 Bjame 
Stroustrup ) 和 Lawrence“Pete”Petersen 合 著 了 本 书 。 我 还 设计 并 讲授 了 面向 大 学 生 初 学 者 (一 年 级 
学 生 ) 的 谋 程 , 这 门 课程 是 与 本 书 同步 发 展 起 来 的 , 以 本 书 的 初稿 作为 教材 。 

Bjame Stroustrup 

我 是 C++ 语 言 的 设计 者 和 最 初 的 实现 者 。 在 过 去 的 大 约 30 
年 间 , 我 使 用 C++ 和 许多 其 他 程序 设计 语言 进行 过 各 种 各 样 的 
编程 工作 。 我 育 欢 那些 用 在 富有 挑战 性 的 应 用 (如 机 器 人 控制 、 
绘图 、 游 戏 、 文 本 分 析 以 及 网 络 应 用 ) 中 的 优美 而 又 高 效 的 代码 。 
我 教 过 能 力 和 兴趣 各 异 的 人 设计 、 编程 和 C++ 语言 。 我 是 ISO 
标准 组 织 C++ 委员 会 的 创建 者 , 现在 我 是 该 委员 会 语言 演化 工 
作 组 的 主席 。 

这 是 我 第 一 本 入 门 级 的 书 。 我 编著 的 其 他 书籍 ， 如 《The 
C++ Programming Language》 和 《The Design and Evolution of C++》 都 是 面向 有 经 验 的 程序 员 的 。 

我 生 于 丹麦 奥 尔 衣 期 一 个 蓝领 (工人 阶级 ) 家 庭 , 在 家 乡 的 大 学 获得 了 数学 与 计算 机 科学 硕士 
学 位 。 我 的 计算 机 科学 博士 学 位 是 在 英国 剑桥 大 学 获得 的 。 我 为 AT&T 工作 了 大 约 25 年 ， 最初 
在 著名 的 贝尔 实验 室 的 计算 机 科学 研究 中 心 一 一 UNIX、C、C++ 及 其 他 很 多 东西 的 发 明 地 , 后 来 
在 AT&T 研究 实验 室 。 

我 现在 是 美国 国家 工程 院 的 院士 ,ACM 院士 和 IEEE 院士 , 贝尔 实验 室 院士 和 AT&T 院士 。 
我 获得 了 2005 年 度 Sigma Xi 科学 研究 社区 科学 成 就 William Procter 奖 , 我 是 首位 获得 此 奖 的 计算 
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机 科学 家 。 

至 于 工作 之 外 的 生活 , 我 已 婚 并 有 两 个 孩子 , 一 个 是 医学 博士 , 另 一 个 目前 是 博士 生 。 我 喜 
欢 阅 读 (包括 历史 、 科幻 、 犯罪 及 时 事 等 各 类 书籍 ), 还 喜欢 各 种 音乐 (包括 古典 音乐 、 摇 滚 、 蓝 调 
和 乡村 音乐 ) 。 和 朋友 一 起 享受 美食 是 我 生活 中 必 不 可 少 的 一 部 分 , 我 还 喜欢 访问 世界 各 地 有 趣 、 
的 地 方 和 人 。 为 了 能 够 享受 美食 , 我 还 坚持 跑步 。 

关于 我 的 更 多 的 信息 ， 请 浏览 我 的 网 站 ; www. research. att. com/ ~ bs 和 www. cs. tamu. edu/ 
people/faculty/bs。 特 别 地 , 你 可 以 在 那里 找到 我 名 字 的 正确 发 音 。 

Lawrence “ Pete” Petersen 

在 2006 年 末 , Pete 如 此 介绍 他 自己 :“ 我 是 一 名 教师 。 将 近 
20 年 来 , 我 一 直 在 德州 农工 大 学 讲授 程序 设计 。 我 已 5 次 被 学 生 
选 为 优秀 教师 , 并 于 1996 年 被 工程 学 院 的 校友 会 选 为 杰出 教师 。 
我 是 Wakonse 优秀 教师 计划 的 委员 和 教师 发 展 研究 院 院士 。 

作为 一 名 陆军 军官 的 儿子 , 我 的 童年 是 在 不 断 迁 移 中 度 过 “ 
的 。 在 华盛顿 大 学 获得 哲学 学 位 后 , 我 作为 野战 炮兵 官员 和 操作 
测试 研究 分 析 员 在 军队 服役 了 22 年 。1971 年 至 1973 年 期 间 , 我 ， | 
在 俄 克 拉 荷 马 希 尔 保 讲 授 野 战 炮 兵 军 官 的 高 级 课程 。 1979 年 ， 我 En 
帮助 创建 了 测试 军官 的 训练 课程 ,并 在 1978 ~ 1981 年 及 1985 ~ 1989 年 期 间 在 跨越 美国 的 九 个 不 
同 地 方 以 首席 教官 的 身份 讲授 这 门 课程 。 

1991 年 我 组 建 了 一 个 小 型 的 软件 公司 , 生产 供 大 学 院 系 使 用 的 管理 软件 , 直至 1999 年 。 我 
的 兴趣 在 于 讲授 、 设 计 和 实现 供 人 使 用 的 实用 软件 。 我 在 佐治 亚 理工 大 学 获得 了 工业 管理 学 硕士 
学 位 , 在 德州 农工 大 学 获得 了 教育 管理 学 硕士 学 位 。 我 还 从 NTS 获得 了 微型 计算 机 硕士 学 位 。 我 
的 信息 和 运营 管理 学 博士 学 位 是 在 德州 农工 大 学 获得 的 。 

我 的 妻子 芭 芭 拉 和 我 都 生 于 德州 的 布 菜 恩 。 我 们 喜欢 旅行 、 园 艺 和 招待 朋友 ; 我 们 花 尽 可 能 
多 的 时 间 陪 我 们 的 儿子 们 和 他 们 的 家 人 , 特别 是 我 们 的 几 个 孙子 孙女 , 安吉 丽 娜 、 卡 洛斯 、 若 丝 、 
埃 弗 里 、 尼 古 拉 斯 和 乔丹 。” 

令 人 悲伤 的 是 ,Pete 于 2007 年 死 于 肺癌 。 如 果 没 有 他 , 这 门 课程 绝对 不 会 取得 成 功 。 


所 》 附 言 

很 多 章 都 提供 了 一 个 简短 的 “ 附 言 ”, 试图 给 出 本 章 所 介绍 内 容 的 全 景 描述 。 这 样 做 是 因为 我 们 意识 到 ， 
知识 可 能 是 (而且 通 常 就 是 ) 令 人 彼 缩 的 ， 只 有 当 完 成 了 习题 、 学 习 了 进一步 的 章节 (应 用 了 本 章 中 提出 的 思 
想 ) 并 进行 了 复习 之 后 才能 完全 理解 。 不 要 铠 惨 , 放 轻 松 , 这 是 很 自然 的 , 也 是 可 以 预料 的 。 你 不 可 能 一 天 
之 内 就 成 为 专家 , 但 可 以 通过 学 习 本 书 逐 步 成 为 一 名 相当 胜任 的 程序 员 。 学 习 过 程 中 , 你 会 遇 到 很 多 知识 、 
实例 和 技术 , 很 多 程序 员 已 经 从 中 发 现 了 令 人 激动 的 和 有 趣 的 东西 。 






第 1 章 计算机、 人 与 程序 设计 


¢é 只 昆 忠 才 专 业 人 a 
—R. A. Heinlein 


在 本 章 中 , 我 们 讲 一 些 可 以 使 程序 设计 变 得 重要 和 有 趣 的 事情 。 我 们 也 讲 一 些 基 本 的 思想 与 
理想 。 我 们 希望 揭穿 几 个 有 关 程 序 设计 与 程序 员 的 流行 的 神话 。 本 章 是 现在 可 以 跳 过 的 内 容 , 当 
你 困扰 于 一 些 编程 问题 和 怀疑 是 否 值得 阅读 时 , 可 以 返回 阅读 本 章 。 


1.1 介绍 


正如 大 多 数 的 学 习 一 样 ,学习 程序 设计 就 像 鸡 和 和 蛋 的 问题 。 我 们 希望 开始 学 习 一 件 事 , 但 是 
我 们 也 希望 了 解 为 什么 学 习 它 。 我 们 想 学 习 一 种 实用 技能 , 但 是 我 们 也 希望 确定 它 不 只 是 短暂 的 
流行 。 我 们 希望 知道 自己 将 不 会 浪费 时 间 , 但 是 我 们 也 希望 不 被 炒作 和 道德 说 教 所 打扰 。 现 在 ， 
我 们 仅 抱 着 有 兴趣 的 态度 来 阅读 本 章 , 并 在 为 什么 技术 细节 会 符合 课堂 外 的 情况 , 而 感到 要 更 新 
记忆 时 返回 来 阅读 。 

本 章 是 对 如 何 发 现 编程 的 兴趣 与 重要 性 的 个 人 陈述 。 它 解释 了 是 什么 激励 我 们 数 十 年 后 还 
在 这 个 领域 中 不 断 前 进 。 通 过 阅读 本 章 会 得 到 可 能 的 最 终 目 标 和 程序 员 可 能 是 哪 种 人 的 想法 。 
针对 初学 者 的 技术 书籍 毫 无 疑问 会 包含 很 多 基础 的 内 容 。 在 本 章 中 , 我 们 将 眼睛 从 技术 细节 上 移 
开 , 并 且 考虑 一 个 更 大 的 画面 : 为 什么 程序 设计 是 一 个 有 价值 的 活动 ? 程序 设计 在 我 们 的 文明 中 
扮演 怎样 的 角色 ? 程序 员 所 做 的 贡献 娜 里 值得 骄傲 ? 程序 设计 如 何 融入 软件 开发 、 部 署 和 维护 这 
一 更 大 的 领域 ? 当 人 们 谈论 “计算机 科学 ” “软件 工程 " “信息 技术 ”等 时 , 程序 设计 如 何 融和 人 其 
中 ? 一 个 程序 员 需 要 做 什么 ? 一 个 好 的 程序 员 需 要 具备 哪些 技能 ? 

对 于 一 个 学 生来 说 , 理解 一 种 思想 、 一 项 技术 或 一 章 的 最 紧迫 的 原因 , 可 能 是 以 好 的 成 绩 通 
过 一 次 考试 , 但 是 在 这 里 会 有 更 多 比 学 习 重要 的 东西 ! 对 于 那些 在 软件 公司 工作 的 人 来 说 , 理解 
一 种 思想 、 一 项 技术 或 一 章 的 最 紧迫 的 原因 , 可 能 是 找到 一 些 对 目前 的 项 目 有 帮助 的 东西 , 并 且 
不 会 使 控制 你 的 薪水 、 升 职 和 解雇 的 老板 感到 厌烦 , 但 是 在 这 里 会 有 更 多 比 学 习 重 要 的 东西 ! 当 
我 们 感到 自己 的 工作 会 在 细小 的 方面 改善 人 们 生活 的 世界 , 我 们 会 努力 将 工作 做 到 最 好 。 对 于 那 
些 在 几 年 内 完成 的 任务 (在 专业 和 职业 发 展 中 的 “事情 ”), 理想 和 更 抽象 的 思想 是 决定 性 的 。 

我 们 的 文明 运行 在 软件 之 上 。 改 进 软件 和 发 现 软 件 的 新 用 途 是 个 人 改进 生活 的 两 种 方法 。 
程序 设计 在 这 里 扮演 着 一 个 基本 的 角色 。 


1.2 软件 


好 的 软件 是 看 不 见 的 。 你 不 能 看 到 、 感 觉 、 称 量 或 融 击 它 。 软 件 是 运行 在 计算 机 上 的 程序 的 
集合 。 有 时 候 我 们 可 以 看 到 一 台 计 算 机 。 我 们 通常 仅仅 看 到 由 一 些 东西 构成 的 计算 机 , 例如 一 部 
电话 机 、 一 台 照 相机 、 一 台面 包机 、 一 辆 汽车 或 一 台风 力 发 电机 。 我 们 可 以 看 到 软件 如 何 工作 。 
如 果 软 件 没有 按 预 想 的 方式 工作 , 我 们 会 感到 厌烦 或 受到 伤害 。 如 果 软 件 按 预想 的 方式 工作 而 不 
符合 我 们 的 需要 , 我 们 也 会 感到 厌烦 或 受到 伤害 。 
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世界 上 有 多 少 台 计算 机 ? 我 们 并 不 知道 , 至少 有 数 十 亿 台 。 世 界 上 的 计算 机 数量 有 可 能 超过 
人 的 数量 。2004 年 , 据 ITU( 国际 电信 联盟 , 一 个 联合 国 机 构 ) 的 统计 , 共有 7. 72 亿 台 个 人 计算 机 
(PC) , 以 及 更 多 的 不 属于 PC 的 计算 机 。 

你 每 天 会 使 用 多 少 台 计 算 机 (直接 或 间接 ) ? 在 一 辆 汽车 中 有 超过 30 台 计 算 机 , 在 移动 电话 
中 有 2 台 计 算 机 , 在 MP3 播放 器 中 有 1 台 计算 机 , 在 照相 机 中 有 1 台 计 算 机 。 我 有 自己 的 笔记 本 
电脑 与 台式 电脑 。 在 夏天 保持 温度 与 湿度 的 空调 也 是 1 台 简 单 的 计算 机 。 控 制 计算 机 科学 系 的 电 
梯 也 是 1 台 计 算 机 。 如 果 你 使 用 的 是 现代 的 电视 机 , 那么 其 中 至 少 会 有 1 台 计 算 机 。 如 果 你 进行 
一 次 网 上 冲浪 ,将 会 通过 通信 系统 接触 几 十 、 也 可 能 几 百 台 服 务 器 , 通信 系统 中 又 包含 数 千 台 计 
算 机 (电话 交换 机 、 路 由 器 等 ) 。 

我 并 不 是 在 驾驶 一 辆 后 座 上 带 着 30 台 笔记 本 电脑 的 汽车 ! 重点 是 这 些 计算 机 看 起 来 不 像 通 
常 的 计算 机 ( 带 有 一 个 屏幕 、 一 个 键盘 和 一 个 鼠标 等 ) ; 它们 作为 很 小 的 一 个 “零件 ”嵌入 我 们 使 用 
的 设备 中 。 正 因为 如 此 , 汽车 中 没有 哪个 东西 看 起 来 像 计 算 机 ， 即 使 是 用 于 显示 地 图 和 行驶 方向 
的 屏幕 (这 种 小 工具 在 汽车 中 很 流行 ) 。 但 是 , 在 汽车 引擎 中 会 包含 几 台 计算 机 , 用 于 完成 燃油 喷 
射 控 制 与 温度 监控 工作 。 汽 车 的 助力 转向 系统 包含 至 少 1 台 计 算 机 , 广播 与 安全 系统 包含 多 台 计 
算 机 , 我 们 甚至 怀疑 车 窗 的 开启 /关闭 都 由 计算 机 来 控制 。 新 型 号 的 汽车 甚至 有 用 于 持续 检测 轮 
胎 气 压 的 计算 机 。 

你 在 日 常生 活 中 所 做 的 事情 需要 依赖 于 多 少 台 计算 机 ? 你 需要 吃饭 ; 如 果 你 生活 在 一 个 现代 
化 的 城市 中 , 为 了 将 食物 提供 给 你 ,需要 计划 、 运 输 和 存储 。 对 这 一 分 配 网 络 的 管理 当然 是 计算 
机 化 的 , 它们 之 间 通 过 通信 系统 连接 起 来 。 现 代 化 农业 也 是 高 度 计 算 机 化 的 , 你 可 以 在 牛 合 附 近 
发 现 用 于 监控 牛 群 (年 龄 、 健 康 、 产 奶 量 等 ) 的 计算 机 ,农业 设备 也 越 来 越 计算 机 化 。 如 果 某 些 事 
情 出 错 , 你 可 以 在 报纸 上 阅读 到 它 。 当 然 , 报纸 上 的 文章 通过 计算 机 来 书写 , 通过 计算 机 来 进行 
页 面 设置 , 以 及 通过 计算 机 设备 来 印刷 (如 果 你 仍 阅读 纸 质 的 报纸 ) , 通常 需要 以 电子 形式 传输 到 
印刷 厂 。 书 籍 的 生产 采用 的 是 同样 的 方式 。 如 果 你 需要 上 下 班 , 计算 机 通过 监控 交通 流量 以 避免 
交通 堵塞 的 。 你 喜欢 乘坐 火车 ”火车 也 是 计算 机 化 的 。 有 些 操作 甚至 不 需要 司机 来 完成 , 火车 的 
子 系统 (广播 、 刹 车 和 监 票 ) 包 括 很 多 计算 机 。 今 天 的 娱乐 业 ( 音乐 、 电影 、 电 视 、 舞 台 表 演 ) 是 大 
量 使 用 计算 机 的 用 户 。 即 使 非 卡通 的 电影 也 在 大 量 使 用 ( 计算 机 ) 动画 , 音乐 和 摄影 也 趋向 于 数字 
化 存储 和 传输 (使 用 计算 机 ) 。 如 果 你 生病 , 医生 为 你 做 的 检查 要 使 用 计算 机 , 病历 通常 是 计算 机 
化 的 , 大 多 数 你 遇 到 的 用 于 治疗 的 医学 仪器 也 包含 计算 机 。 除 非 你 碰巧 住 在 树林 中 的 草 屋 中 , 并 
且 不 使 用 任何 电动 工具 (包括 电灯 ) , 否则 你 都 会 使 用 能 源 。 石 油 被 发 现 、 提炼 、 加 工 和 传输 的 过 
程 , 从 钻头 深入 地 下 到 本 地 的 汽油 (天 然 气 ) 加 油 站 , 整个 过 程 中 的 每 个 步骤 都 要 使 用 计算 机 。 如 
果 你 使 用 信用 卡 来 购买 汽油 ,你 也 会 访问 一 组 计算 机 。 对 于 煤炭 、 天 然 气 、 太 阳 能 和 风力 发 电 ， 
它们 都 会 经 过 同样 的 过 程 。 

迄今 为 止 的 例子 都 是 “可 操作 的 ”, 它们 都 直接 包含 在 你 所 做 的 事情 中 。 你 未 参与 其 中 的 事情 
是 设计 中 的 重要 和 有 趣 的 部 分 。 你 穿着 的 衣服 、 你 交谈 用 的 电话 和 你 调制 自己 喜欢 的 饮料 用 的 咖 
啡 机 ， 这 些 都 是 通过 计算 机 来 设计 与 生产 的 。 优 质 的 现代 摄影 镜头 、 造 型 精美 的 日 常 工具 和 器 
具 , 这 些 几乎 都 要 归功 于 基于 计算 机 的 设计 与 生产 方式 。 那 些 设计 我 们 周围 环境 的 工匠 、 设计 
师 、 艺 术 家 和 工程 师 , 他 们 从 很 多 以 前 被 认为 是 基本 工作 的 物理 限制 中 解脱 出 来 。 如 果 你 生病 ， 
那些 用 来 治愈 你 的 药品 也 是 使 用 计算 机 设计 的 。 

最 后 , 科学 研究 本 身 严重 依赖 于 计算 机 。 对 于 用 于 探索 遥远 的 恒星 秘密 的 望远镜 ,它们 离开 
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计算 机 是 无 法 设计 、 制造 和 操作 的 , 它们 产生 的 大 量 数据 离开 计算 机 是 无 法 处 理 的 5 个 别 生物 学 
领域 的 研究 人 员 没 有 被 严重 计算 机 化 (不 包括 照相 机 、 数字 录音 机 、 电 话 等 的 伟 用 ) - 但 有 是 回 到 守 
验 室 中 , 数据 要 使 用 计算 机 模型 来 储存 、 分 析 和 检查 , 并 且 要 和 其 他 科研 人 员 通 信 。 现代 化 学 和 
生物 学 (包括 医学 ) 大 量 使 用 计算 机 , 在 几 年 前 就 达到 人 们 做 梦 也 想不到 的 程度 , 并 且 至 今 对 大 多 
数 人 仍 是 难以 想象 的 。 人 类 基因 测序 是 通过 计算 机 完成 的 。 让 我 们 描述 得 更 准确 一 些 ,， 人 类 基因 
测序 是 人 使 用 计算 机 完成 的 。 在 所 有 这 些 例 子 中 , 我 们 可 以 看 到 计算 机 可 以 帮助 我 们 完成 某 些 
事 , 在 没有 计算 机 的 情况 下 需要 花费 更 多 时 间 。 

每 台 计 算 机 都 需要 运行 软件 。 如 果 没 有 软件 , 计算 机 就 是 由 硅 、 金属 和 塑料 组 成 的 昂贵 的 大 
块头 , 其 与 门 吸 、 船 锚 和 空间 加 热 器 没有 多 大 区 别 。 软 件 中 的 每 行 代码 都 是 由 不 同 的 人 编写 的 。 
如 有 果 软 件 在 运行 中 有 错误 , 实际 执行 的 每 行 在 合理 的 最 低 限 度 内 。 它 们 都 正常 运行 是 很 惊人 的 
事 。 我 们 谈论 的 是 用 几 百 种 编程 语言 编写 的 几 十 亿 行程 序 代码 (或 程序 文本 ) 。 使 它们 都 正常 运 
行 需要 付出 惊人 的 代价 和 令 人 难以 想象 的 技巧 。 我 们 希望 对 所 依赖 的 每 种 服务 和 工具 进行 更 多 
的 改变 。 思 考 一 下 你 所 依赖 的 某 种 服务 和 工具 , 你 希望 看 到 它们 有 怎样 的 改进 ? 如 果 没 有 的 话 ， 
我 们 希望 服务 和 工具 更 小 (或 更 大 ) 、 更 快 、 更 可 靠 、 更 有 特点 、 更 容易 使 用 、 更 高 性 能 、 更 好 看 和 
更 便宜 。 这 些 我 们 想 做 的 改进 的 相似 点 是 都 需要 编程 。 


1.3 人 


计算 机 是 人 制造 的 , 供 人 使 用 的 。 计 算 机 是 一 种 非常 通用 性 的 工具 , 它 可 以 被 用 于 很 多 你 无 
法 想象 的 任务 。 计 算 机 运行 一 个 程序 , 以 使 它 对 一 些 人 有 用 。 换 句 话 说 , 计算 机 只 是 一 个 硬件 ， 
直到 一 些 人 (程序 员 ) 编写 代码 使 它 能 做 某 些 事情 。 我 们 经 常会 忘记 软件 ,甚至 经 常会 忘记 程 
序 员 。 

好 莱 坞 和 类 似 的 “流行 文化 "等 谣言 的 来 源 已 经 给 程序 员 带 来 很 大 的 负面 影响 。 例 如 , 我 们 总 
是 看 到 孤独 的 、 肥 胖 的 、 丑陋 的 、 不 懂 社 交 技 巧 的 讨厌 鬼 , 并 且 总 是 痴迷 于 视频 游戏 和 闻 人 其 他 
人 的 计算 机 。 他 (几乎 总 是 男人 ) 可 能 是 想 毁 灭 世界 , 也 可 能 是 想 拯救 世界 。 很 明显 ,这 种 漫画 人 
物 的 “温和 版 本 ”在 现实 生活 中 确实 存在 , 但 是 依 我 们 的 经 验 他 们 中 的 软件 开发 者 ,并 不 比 律师 、 
警官 、 汽 车 销售 员 、 记 者 、 艺 术 家 或 政治 家 更 多 。 

我 们 思考 一 下 计算 机 在 现实 生活 中 的 应 用 。 它 们 是 在 一 个 黑 屋 子 中 独立 工作 吗 ? 当然 不 是 ， 
一 个 成 功 的 软件 、 计 算 机 设备 或 系统 的 创建 , 需要 包括 几 十 、 几 百 或 几 千 人 扮演 一 系列 扑朔迷离 
的 角色 , 例如 程序 员 、( 程 序 ) 设 计 者 、 测 试 人 员 、 美 工人 员 、 开 发 小 组 管理 者 、 实 验 心理 学 家 、 用 
户 界面 设计 者 、 分 析 人 员 、 系 统管 理 员 、 客 户 关系 人 员 、 音 效 工 程 师 、 项 目 经 理 、 质 量 工程 师 、 统 
计 人 员 、 硬 件 接口 工程 师 、 需求 分 析 工 程 师 、 安全 主管 、 数 学 家 、 销售 支 持 人 员 、 答疑 人 员 、 网 络 
设计 人 员 、 方法 论 学 家 、 软件 工具 管理 员 、 软 件 库 管理 员 等 。 这 些 角色 的 范围 很 广 , 随 着 组 织 之 
间 的 变换 使 人 更 加 迷惑 。 一 个 组 织 中 的 “工程 师 ” 可 能 是 另 一 个 组 织 中 的 “程序 员 ”, 也 可 能 是 另 
一 个 组 织 中 的 “开发 人 员 ”、“ 技 术 组 成 员 " 或 “结构 设计 师 ”。 这 里 有 多 个 组 织 , 不 同 成 员 可 以 在 
其 中 找到 自己 的 头衔 。 并 不 是 所 有 角色 都 与 编程 直接 相关 。 但 是 , 我 们 每 个 人 都 曾 看 到 人 们 扮演 
每 个 角色 的 例子 ,他 们 将 读 写 代码 作为 自己 工作 的 重要 部 分 。 另 外 , 一 个 程序 员 ( 扮 演 这 些 角色 
中 的 二 个 或 多 个 ) 在 短 时 期 内 会 和 不 同 应 用 领域 的 人 打交道 , 例如 生物 学 家 、 发 动机 设计 师 、 律 
师 、 汽车 销售 员 、 医 学 研究 员 、 历 史学 家 、 地 理学 家 、 宇 航 员 、 飞 机 工程 师 、 木材 库 经 理 、 火 箭 科 
学 家 、 保 龄 球 馆 建设 者 、 记 者 和 漫画 家 (这 是 从 个 人 经 验 中 得 到 的 ) 。 有 些 人 可 能 有 时 是 一 个 程序 
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员 , 而 在 职业 生涯 的 另 一 个 阶段 扮演 非 程序 员 的 角色 。 

程序 员 是 孤立 的 这 一 神话 本 身 只 是 一 个 神话 而 已 。 那 些 喜 欢 工作 在 自己 选择 的 工作 领域 的 
人 , 经常 痛 苦 地 抱怨 被 “打扰 ”或 开会 的 次 数 。 由 于 现代 软件 开发 是 一 种 团队 行为 ,因此 那些 喜欢 
和 别人 交互 的 人 会 感到 更 轻松 。 这 意味 着 社会 和 沟通 能 力 是 必 不 可 少 的 , 并 且 其 价值 远 远大 于 陈 
规 旧 习 。 在 一 份 对 程序 员 很 有 用 的 技能 的 简短 列表 中 (你 是 在 从 现实 的 角度 定义 程序 员 ) , 你 会 发 
现 与 不 同 背 景 的 人 进行 沟通 的 能 力 最 重要 , 这 种 沟通 可 能 是 非 正式 的 会 议 、 书 面 形 式 和 正式 介 
绍 。 我 们 相信 ,除非 你 完成 过 一 个 或 两 个 团队 项 目 , 否则 你 不 会 知道 什么 是 编程 以 及 是 否 喜 欢 它 。 
我 们 喜欢 编程 的 理由 是 我 们 遇 到 的 都 是 很 好 的 、 有 趣 的 人 , 并 且 将 访问 风格 各 异 的 地 方 作为 我 们 
职业 生涯 的 一 部 分 。 

所 有 这 些 是 指 那些 有 各 种 各 样 的 技能 、 兴 趣 和 工作 习惯 的 人 ,对 开发 一 个 好 的 软件 来 说 是 必 
不 可 少 的 。 我 们 的 生活 质量 (有 时 甚至 是 生活 自身 ) 依赖 于 那些 人 。 没 有 人 可 以 扮演 我 们 这 里 提 
到 的 所 有 角色 , 也 没有 明智 的 人 希望 扮演 每 个 角色 。 重 点 是 你 有 比 自己 所 能 想到 的 更 大 的 选择 空 
闻 ,而 不 是 不 得 不 做 出 某 个 特定 的 选择 。 作 为 个 人 , 你 将 “流向 ”那些 符合 你 的 技能 、 才 智和 兴趣 
的 工作 领域 。 

我 们 谈论 的 是 “程序 员 ” 与“ 编程”， 但 是 编程 很 明显 只 是 整个 画面 的 一 个 部 分 。 那 些 设计 船 
只 或 移动 电话 的 人 不 会 将 自己 做 程序 员 。 编 程 是 软件 开发 中 的 一 个 重要 部 分 , 但 并 不 是 全 部 。 相 
似 地 ,对 于 大 多 数 产品 来 说 , 软件 开发 是 产品 开发 中 的 一 个 重要 部 分 , 但 并 不 是 全 部 。 

我 们 并 不 假设 你 (我 们 的 读者 ) 希望 成 为 一 个 专业 程序 员 , 将 剩余 的 工作 生涯 用 于 编写 代码 。 
即使 是 那些 优秀 的 程序 员 , 他 们 也 不 会 将 大 部 分 时 间 用 在 编写 代码 上 。 理 解 问题 需要 占用 更 多 的 
时 间 , 并 且 通 常 更 消耗 智力 。 智 力 挑战 是 很 多 程序 员 认为 编程 有 趣 的 出 发 点 。 很 多 优秀 程序 员 通 
常 不 是 计算 机 科学 专业 的 。 例 如 ,如 果 你 进行 基因 研究 方面 的 软件 开发 ,理解 分 子 生 物 学 将 会 对 
你 有 更 大 的 帮助 。 如 果 你 进行 中 世纪 文学 分 析 方 面 的 程序 设计 , 阅读 一 些 这 类 文学 作品 和 掌握 一 
门 或 多 门 相关 语言 将 会 对 你 有 更 大 的 帮助 。 特 别 是 对 于 抱 有 “只 关心 计算 机 和 编程 "态度 的 人 , 他 
们 将 会 难以 与 那些 非 程序 员 的 同事 交流 。 这 样 的 人 不 仅 会 错过 人 与 人 交流 ( 即 生活 ) 中 最 棒 的 那 
部 分 , 而 且 也 不 会 成 为 成 功 的 软件 开发 人 员 。 

于 是 , 我 们 如 何 假设 呢 ? 编程 是 一 种 挑战 智力 的 技能 , 需要 经 过 很 多 重要 与 有 趣 的 训练 。 另 
外 ,编程 是 我 们 这 个 世界 的 重要 组 成 部 分 , 不 了 解 基 本 的 编程 知识 就 像 不 了 解 基本 的 物理 、 历 史 、 
生物 或 文学 知识 一 样 。 那 些 对 编程 完全 无 知 的 人 相信 它 是 魔术 , 让 这 样 的 人 承担 很 多 技术 工作 是 
危险 的 。 另 外 , 编程 可 以 带 来 乐趣 。 

但 是 , 我 们 如 何 假设 编程 的 用 途 ? 你 也 许 将 编程 作为 未 来 学 习 和 工作 的 重要 工具 , 而 不 是 成 
为 一 个 专业 的 程序 员 。 你 也 许 将 与 其 他 人 进行 专业 和 个 人 的 交流 , 这 些 人 可 能 是 设计 师 、 作 家 、 
经 理 或 科学 家 , 具有 编程 方面 的 基础 知识 将 会 有 一 定 优势 。 你 也 许 将 专业 水 平 的 编程 作为 你 学 习 
和 工作 的 一 部 分 。 即 使 你 成 为 一 个 专业 的 程序 员 , 也 不 意味 着 你 除了 编程 之 外 不 做 任何 事 。 

你 可 能 成 为 一 名 计算 机 或 计算 机 科学 方面 的 工程 师 , 但 是 这 样 也 并 不 是 “编程 占据 所 有 时 
间 ”。 编 程 是 用 代码 表达 你 的 思想 的 方式 , 也 是 一 种 协助 求解 问题 的 方式 。 除 非 你 有 值得 表达 的 
思想 和 值得 解决 的 问题 ， 否 则 编程 没有 用 处 (纯粹 是 浪费 时 间 ) 。 

这 是 一 本 关于 编程 的 书 ,我 们 曾经 承诺 本 书 可 以 帮助 你 学 习 如 何 编程 , 那么 为 什么 我 们 要 强 
调 非 编程 的 内 容 与 编程 的 有 限 作 用 呢 ? 一 个 优秀 的 程序 员 会 理解 代码 和 编程 技术 在 一 个 项 目 中 
的 作用 。 一 个 优秀 的 程序 员 ( 在 多 数 情 况 下 ) 是 一 个 优秀 的 团队 成 员 , 并 且 会 努力 理解 代码 和 其 产 
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品 如 何 很 好 地 支持 整个 项 目 。 例 如 , 想象 我 在 为 一 个 新 的 MP3 播放 器 进行 编程 ， 则 我 关心 的 只 是 
代码 优美 程度 和 提供 的 简洁 功能 的 数量 。 我 可 能 一 直 在 大 型 的 、 功 能 强大 的 计算 机 上 运行 这 些 代 
码 。 我 可 能 对 声音 编码 理论 不 屑 一 顾 ， 因为 它 是 “与 编程 无 关 的 ”。 我 将 会 待 在 自己 的 实验 室 里 ， 
而 不 是 走出 去 与 潜在 的 用 户 交 流 。 这 样 ,用 户 毫 无 疑问 将 对 音乐 有 不 好 的 体验 , 并 且 不 欣赏 图 形 
用 户 界面 (GUI) 编程 的 最 新 发 展 。 这 样 做 的 后 果 是 可 能 对 项 目 带 来 一 场 灾难 。 更 大 的 计算 机 意味 
着 更 昂贵 的 MP3 播放 器 和 更 短 的 电池 寿命 。 编 码 是 数字 化 音乐 控制 的 重要 部 分 , 忽视 编码 技术 
的 发 展会 导致 每 首 歌曲 增加 所 需 的 存储 空间 (不 同 编码 获得 相同 品质 的 输出 时 的 存储 空间 大 小 差 
异 超过 100% ) 。 无 视 用 户 的 喜好 (在 你 看 来 是 奇怪 的 和 过 时 的 ) , 通常 会 导致 用 户 选 择 其 他 产品 。 
编写 一 个 好 的 程序 的 重要 部 分 是 理解 用 户 的 需求 , 并 且 在 执行 ( 即 编码 ) 时 实现 这 些 需求 。 为 了 完 
成 上 述 对 一 个 坏 程序 员 的 描绘 , 我 倾向 于 将 其 描述 成 对 细节 的 狂热 和 对 简单 测试 的 代码 正确 性 的 
过 分 自信 。 我 们 鼓励 你 成 为 一 个 好 的 程序 员 ,， 只 有 具有 广 冰 的 视野 才能 生产 出 好 的 软件 。 这 既是 
社会 价值 也 是 个 人 自我 实现 之 所 在 。 


1.4 计算 机 科学 


即使 是 在 最 广泛 的 定义 中 , 也 最 好 将 编程 看 做 某 些 更 大 事物 的 一 部 分 。 我 们 可 以 将 编程 看 做 
计算 机 科学 、 计 算 机 工程 、 软 件 工程 、 信 息 技术 或 其 他 软件 相关 的 学 科 。 我 们 将 编程 看 做 科学 和 
工程 中 的 计算 机 和 信息 领域 的 实现 技术 , 同样 也 是 物理 学 、 生 物 学 、 医 学 、 历 史学 、 文 学 和 其 他 学 
术 或 研究 领域 的 实现 技术 。 

请 思考 计算 机 科学 。 在 1995 年 , 美国 政府 的 “蓝皮书 "对 它 的 定义 如 下 :“ 对 计算 系统 和 计算 
的 系统 研究 。 这 个 学 科 造 就 的 知识 体系 包含 理解 计算 系统 和 方法 的 理论 , 设计 方法 学 、 算 法 和 工 
具 , 测试 概念 的 方法 , 分析 和 验证 的 方法 , 以 及 知识 的 表示 和 实现 。 正 如 我 们 所 预料 的 那样 ， 维 
基 百 科 条 目 所 给 出 的 概念 不 太 正 式 :“ 计 算 机 科学 或 计算 科学 是 对 信息 和 计算 的 理论 基础 的 研究 ， 
以 及 它们 在 计算 机 系统 中 的 实现 和 应 用 。 计 算 机 科学 包含 很 多 子 领域 , 有些 强 调 特定 结果 的 计算 
(例如 计算 机 图 形 学 ) , 另 一 些 关于 计算 问题 的 性 能 (例如 计算 复杂 度 理论 ) 。 有 些 集中 在 实现 计 
算 的 挑战 上 。 例 如 , 编程 语言 理论 研究 描述 计算 的 方法 , 而 计算 机 编程 使 用 特定 的 编程 语言 来 解 
决 特定 的 计算 问题 。” z 

编程 是 一 种 工具 。 它 是 一 种 针对 基础 和 实践 问题 的 基本 工具 , 使 这 些 问题 可 以 通过 实验 来 测 
试 、 改 进 和 应 用 。 编 程 是 思想 和 理论 的 实际 交汇 。 这 是 计算 机 科学 可 以 成 为 一 种 实践 训练 而 不 是 
纯 理论 , 并 且 影 响 世 界 的 原因 所 在 。 在 这 方面 和 很 多 其 他 事情 一 样 , 编程 必 不 可 少 的 是 训练 和 
实践 的 良好 结合 。 它 不 应 退化 为 这 样 一 种 活动 : 只 是 编写 一 些 代码 , 用 旧 的 方式 满足 眼前 的 简单 
需求 。 


1.5 计算 机 已 无 处 不 在 


没有 人 知道 计算 机 或 软件 相关 的 所 有 事 。 本 节 内 容 只 是 给 出 一 些 例子 。 你 也 许 会 看 到 自己 
想 看 的 东西 。 你 至 少 可 以 理解 计算 机 的 应 用 范围 和 编程 所 涵盖 的 范围 远 远 超 出 任何 个 人 可 以 完 
全 掌握 的 程度 。 

大 多 数 人 认为 计算 机 上 只 是 一 个 带 有 显示 髓 和 键盘 的 灰色 盒子 。 这 种 计算 机 往往 被 放置 在 桌 
子 下面 , 用 于 玩 游戏 、 收 发 消息 和 邮件 、 播 放 音 乐 。 另 一 些 计 算 机 称 为 笔记 本 电脑 ,它们 被 无 著 
的 商人 们 在 飞机 上 使 用 , 查看 报表 、 玩 游戏 和 观看 视频 。 这 种 讽刺 性 的 描述 只 是 冰 出 一角。 大 多 
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数 的 计算 机 工作 在 我 们 看 不 到 的 地 方 , 并 且 作为 保持 社会 运转 的 系统 的 一 部 分 。 它 们 中 的 一 些 可 
能 占据 整个 房间 , 另 一 些 可 能 比 一 枚 小 的 硬币 还 小 。 这 些 有 趣 的 计算 机 不 是 通过 键盘 、 鼠 标 或 类 
似 的 设备 直接 与 人 进行 交互 。 
1.5.1 有 屏幕 和 没有 屏幕 


计算 机 是 一 个 相当 大 的 、 党 有 昼 矢 和 钢 盘 的 方 全 于 的 想法 很 普 这 ， 并 且 通 常 是 难以 动 播 的 。 
但 是 , 我 们 考虑 一 下 这 两 种 计算 机 : 





这 两 种 用 于 计时 的 工具 本 质 上 也 是 计算 机 。 实 际 上 , 我 们 猜测 它们 基本 上 是 带 有 不 同 WO( 输 入 / 
输出 ) 系 统 的 相同 模式 计算 机 。 左 边 那个 驱动 一 个 小 的 屏幕 (与 普通 计算 机 的 屏幕 类 似 , 但 是 更 
小 ) , 第 二 个 驱动 小 的 电子 发 动机 来 控制 传统 的 表 针 和 用 于 表示 日 、 月 的 数字 表盘 。 这 些 输入 系 
统 都 有 4 个 按钮 ( 右边 那个 更 容易 看 清楚 ) 和 1 个 无 线 电 接收 器 , 它 被 用 于 与 非常 精确 的 “原子 ”时 
钟 保持 同步 。 控 制 这 两 个 计算 机 的 大 多 数 程序 都 是 相同 的 。 

1.5.2 船舶 


这 两 张 图 片 显 示 的 是 一 台大 型 的 船用 柴油 机 和 它 可 能 驱动 的 巨大 的 船 船 : 





我 们 考虑 一 下 计算 机 和 软件 在 这 里 扮演 的 重要 角色 : 

。 设计 : 当然 ,船舶 和 引擎 都 是 使 用 计算 机 来 设计 的 。 这 个 过 程 中 用 到 计算 机 的 地 方 非常 
多 , 主要 包括 结构 和 工程 制图 、 一 般 的 计算 、 空 间 和 部 件 的 可 视 化 以 及 性 能 的 模拟 。 

。 建造 ; 现代 化 的 造船 厂 是 高 度 计 算 机 化 的 。 船 舶 组 装 是 通过 计算 机 来 严格 规划 的 , 工作 是 
通过 计算 机 来 指导 的 。 焊 接 是 由 机 器 人 来 完成 的 。 特 别 是 双 壳 油船 , 没有 小 的 焊接 机 器 
人 在 壳 体 之 间 焊 接 是 无 法 完成 的 。 那 里 没有 可 以 容纳 一 个 人 的 空间 。 为 船舶 切割 钢板 是 
世界 上 最 早 的 CAD/CAM( 计算 机 辅助 设计 和 计算 机 辅助 制造 ) 应 用 之 一 。 

。 引擎 : 引擎 采用 电子 燃料 喷射 技术 ,和 由 数 十 台 计 算 机 控制 。 对 于 一 台 10 万 马力 的 引擎 
(就 像 照片 中 的 那 台 ) , 这 是 一 个 非 同 一 般 的 任务 。 例 如 ,3 引擎 管理 计算 机 要 持续 调节 燃 
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料 注入 ,以 便 将 引擎 不 协调 可 能 导致 的 污染 降 到 最 小 。 很 多 与 引擎 相连 接 的 泵 (船舶 的 其 
他 部 分 ) 本 身 也 是 计算 机 化 的 。 z 
。 管理: 船舶 需要 航行 到 特定 的 港口 去 装卸 货物 。 船 队 的 日 程 安排 是 一 个 持续 的 过 程 ( 当然 
是 计算 机 化 的 ) , 其 目标 是 可 以 根据 气象 、 供 应 和 需求 、 港 口 的 空间 和 吞吐 量 来 调整 航线 。 
甚至 有 网 站 可 以 用 来 查询 大 型 商船 在 某 个 时 刻 的 位 置 。 照 片 中 的 船舶 碰巧 是 一 般 集 装 箱 
船 (这 个 世界 上 最 大 的 船舶 , 397 米 长 和 56 米 宽 ) 。 其 他 类 型 的 大 型 现代 化 船舶 都 以 相似 
的 方式 进行 管理 。 
。 监控 : 一 艘 远洋 船舶 在 很 大 程度 上 是 自治 的 , 它 的 全 体 船员 可 以 在 到 达 下 一 个 港口 前 处 理 
大 多 数 可 能 产生 的 紧急 事件 。 但 是 , 它们 仍 是 一 个 全 球 网 络 中 的 一 部 分 。 船 员 可 以 访问 
相当 精确 的 气象 信息 (通过 计算 机 化 的 人 造 卫 星 ) 。 它 们 拥有 GPS( 全 球 定位 系统 ) 和 计算 
机 控制 、 计 算 机 增强 的 雷达 。 如 果 船 员 需要 休息 ,大 多 数 系统 (包括 引擎 、 雷 达 等 ) 可 以 在 
航线 控制 室 中 进行 监控 (通过 卫星 ) 。 如 果 发 现任 何 异 常 或 通信 连接 中 断 , 船员 会 收 到 
通知 。 
让 我 们 考虑 一 下 ,如 果 在 这 段 简短 的 介绍 中 明确 提 到 或 暗示 的 数 百 台 计算 机 之 一 出 现 故 障 将 意味 
着 什么 。 在 第 25 章 (“嵌入 式 系统 编程 ” ) 中 , 将 会 对 这 种 情况 做 出 稍微 详细 的 解释 。 为 一 艘 现代 
化 船舶 编 写 代码 是 一 件 讲究 技巧 且 有 趣 的 事 。 它 也 是 很 有 用 的 。 运 输 成 本 实际 上 是 很 低廉 的 。 你 
在 购买 那些 不 在 本 地 生产 的 东西 时 会 赞成 这 一 点 。 海 洋 运 输 总 是 比 陆 地 运输 更 便宜 , 其 主要 原因 
在 于 计算 机 和 信息 的 大 量 使 用 。 
1.5.3 电信 
这 两 张 图 片 显示 的 是 一 台电 话 交换 机 和 一 部 电话 ( 它 碰巧 还 是 一 台 照 相机 、 一 台 MP3 播放 
器 、 一 台 FM 收音 机 和 一 
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我 们 考虑 一 下 计算 机 和 软件 在 这 里 扮演 的 角色 。 你 拿 起 一 部 电话 拨号 , 你 所 拨 叫 的 人 响应 , 然后 
你 们 可 以 通话 。 你 可 能 是 在 与 一 台 应 答 器 通话 , 可 能 通过 电话 中 的 照相 机 发 送 一 张 照 片 , 或 者 发 
送 一 条 文本 消息 ( 按 “发 送 "使 电话 完成 拨号 ) 。 很 明显 ,电话 是 一 台 计算 机 。 如 果 电 话 ( 像 多 数 的 
移动 电话 ) 拥 有 一 个 屏幕 , 并 且 提 供 更 多 超过 传统 “老式 电话 服务 ”的 功能 (如 Web 浏览 器 ) , 则 这 
种 情况 将 会 特别 明显 。 实 际 上 , 这 类 电话 通常 包含 多 台 计 算 机 : 一 台 用 于 管理 屏幕 , 一 台 用 于 与 
电话 系统 通话 , 可 能 还 会 包含 更 多 计算 机 。 

计算 机 用 户 最 熟悉 的 可 能 是 电话 中 的 管理 屏幕 、 进 行 Web 浏览 等 : 它 为 “< 所 有 常见 的 功能 ” 提 
供 一 个 图 形 化 用 户 界面 。 大 多 数 用 户 不 知道 、 甚至 感到 意外 的 是 与 小 的 电话 协作 ,完成 通话 工作 
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背后 的 庞大 系统 。 我 拨 叫 一 个 德 克 萨 斯 州 的 号 码 , 而 这 时 你 正在 纽约 城 度假 , 但 是 你 的 电话 铃声 
在 几 秘 钟 内 响起 , 并 且 我 听 到 你 伴 着 城市 交通 的 嘲 杂 声 说 “你 好 ! ”。 很 多 电话 可 以 在 地 球 上 的 两 
个 位 置 之 间 通话 , 我 们 认为 这 是 理所当然 的 。 我 的 电话 如 何 找到 你 的 电话 ? 声音 如 何 被 传输 ? 声 
音 如 何 被 编码 加 和 数据 包 ? 这 些 问 题 的 答案 可 以 填 满 比 本 书 更 厚 的 几 本 书 , 但 是 它 会 涉及 分 布 在 
相关 地 理 区 域 中 的 数 百 台 计 算 机 中 的 软件 和 人 硬件。 如 果 你 是 不 幸 的 , 还 会 涉及 几 个 通信 卫星 ( 它 
们 也 是 计算 机 化 的 )。“ 不 幸 ” 的 原因 是 我 们 不 能 完全 补偿 进入 2 万 英里 的 太空 的 代价 , 光速 ( 因 
此 是 你 的 声音 传播 的 速度 ) 是 有 限 的 (光纤 电缆 更 好 : 更 短 、 更 快 和 传输 更 多 数据 )。 这 些 工作 多 
数 是 很 好 的 ,骨干 通信 系统 的 可 靠 性 可 以 达到 99. 9999% (例如 , 在 20 年 中 有 20 分 钟 断 线 ; 等 于 
20/20 x365 x24 x60)。 我 们 遇 到 的 麻烦 通常 出 现在 移动 电话 和 最 近 的 电话 交换 机 之 间 的 通信 。 

在 这 里 , 软件 用 于 在 电话 之 间 建 立 连接 , 用 于 将 语音 编码 为 数据 包 通 过 有 线 或 无 线 链 路 传 
输 , 用 于 路 由 这 些 消息 , 用 于 恢复 各 种 故障 ,用 于 持续 监控 服务 的 质量 和 可 靠 性 ， 当 然 也 用 于 记 
账 。 跟 足 系 统 中 所 有 物理 部 分 , 也 需要 大 量 智 能 软件 : 谁 和 谁 通 话 ? 哪 部 分 进入 一 个 新 的 系统 ? 
何 时 需要 进行 一 些 预防 性 维护 ? 

这 个 世界 的 主干 通信 系统 由 很 多 半 独 立 但 互 连 的 系统 组 成 , 它 可 能 是 最 大 和 最 复杂 的 人 工 产 
品 。 为 了 使 事情 更 真实 一 些 , 记 住 , 这 不 只 是 令 人 厌烦 的 老式 电话 带 有 一 些 新 的 铃声 或 哨 音 。 各 
种 基础 设施 已 经 合并 。 它 们 也 是 Intermet( Web)、 金融 和 贸易 系统 、 广 播 电 台 播 放 的 电视 节目 运行 
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左 图 是 位 于 纽约 华尔街 的 美国 证 券 交 易 所 的 “交易 大 厅 ”, 右边 的 地 图 表示 部 分 的 Intemet 骨干 网 
(一 张 完整 的 地 图 将 会 更 加 零乱 ) 。 

碰巧 , 我们 也 喜欢 数字 照片 和 用 计算 机 绘制 的 地 图 来 使 知识 可 视 化 。 
1.5.4 医疗 

这 两 张 图 片 显示 的 是 一 台 CAT( 计算 机 轴 向 断层 ) 扫描 仪 和 一 间 计 算 机 辅助 手术 室 ( 也 称 为 
“机 器 人 辅助 手术 ”或 “机 器 人 手术 ”) : 
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考虑 一 下 计算 机 和 软件 在 这 里 扮演 的 重要 角色 。 扫 描 仪 基本 上 就 是 计算 帮 国 它 败 出 的 本 冲 下 天 全 
计算 机 来 控制 , 它 读 取 的 内 容 对 我 们 来 说 是 杂乱 无 章 的 , 除非 将 其 通过 复杂 的 算法 转换 成 我 们 可 
以 识别 的 人 体 相应 部 位 的 (三 维 ) 图像。 为 了 进行 计算 机 化 的 手术 , 必须 分 为 几 个 步骤 。 各 种 成 像 
技术 用 于 使 外 科 医 生 看 清和 患者 的 身体 内 部 , 以 便 尽 可 能 大 和 更 亮 地 看 清 手 术 的 部 位 。 外 科 医 生 供 
助 计算 机 可 以 使 用 人 手 无 法 握 住 的 工具 , 或 者 不 必 割 开 身 体 就 可 到 达 某 些 部 位 。 微 创 手 术 ( 腹腔 
镜 手 术 ) 是 一 个 最 简单 的 例子 ,， 它 减少 了 数 百 万 人 的 痛苦 和 康复 时 间 。 计 算 机 可 以 帮助 稳定 外 科 
医生 的 “ 手 ”, 以 便 完成 正常 情况 下 不 可 能 完成 的 更 细致 的 工作 。 最 后 ,“ 机 器 人 ”系统 可 以 远程 操 
作 , 因此 医生 有 可 能 远程 (通过 Intemet) 医治 病人 。 计 算 机 和 编程 是 难以 置信 和 的、 复杂 的 和 有 趣 
的 。 用 户 界面 、 设备 控制 、 成像 技术 中 的 每 一 项 , 都 足以 让 数 千 名 研究 人 员 .、 工程 师 和 程序 员 忙 
碌 几 十 年 。 

我 们 听 到 很 多 医生 关于 哪 种 新 的 工具 对 他 们 的 工作 最 有 帮助 的 讨论 : CAT 扫描 仪 ” MRI 扫描 
仪 ?自动 血液 分 析 仪 ?高 分 辩 率 超声 波 仪 ?” PDA? 在 经 过 讨论 以 后 , 令 人 惊讶 的 “胜利 者 ”从 这 场 
“竞争 ”中 出 现 ; 即时 访问 病历 。 了 解 患者 的 医疗 中 (早期 疾病 、 早 期 用 药 、 过敏 史 、 遗传 问题 、 一 
般 健康 状况 、 当 前 用 药 等 ) 会 简化 问题 的 诊断 和 减 小 发 生 错 误 的 机 会 。 
1.5.5 信息 领域 

这 两 张 图 片 显 示 的 是 一 台 普 通 PC( 也 可 能 是 两 台 ) 和 服务 器 机 群 的 一 部 分 : 
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我 们 曾经 将 注意 力 集中 在 普通 用 途 的 “工具 ”上 : 你 不 能 看 到 、 感觉 到 或 听 到 软件 。 我 们 无 法 给 你 
提供 一 张 程序 的 图 片 , 因此 我 们 给 你 看 一 下 运行 它 的 “工具 ”。 但 是 , 很 多 软件 直接 处 理 “ 信 息 ”。 
因此 , 让 我 们 来 考虑 一 下 运行 “普通 软件 ”的 “普通 计算 机 ”的 “普通 用 途 ”。 

一 个 “服务 器 机 群 "是 提供 Web 服务 的 多 台 计算 机 的 集合 。 通 过 使 用 Web 搜索 引擎 ,我们 找 
到 由 维基 百科 (一 个 Web 目录 ) 提 供 的 下 列 知识 。 在 2004 年 , 据 估计 搜索 引 警 的 服务 器 机 群 是 以 
下 规模 : | 

。719 个 机 架 

e 63272 台 机 器 

es 126544 个 CPU 

。253THz 的 处 理 能 力 

s 126544GB 的 内 存 

e 5062TB 的 硬盘 空间 

一 个 GB 是 1G 字 节 , 大 约 是 1000000000 个 字符 。 一 个 TB 是 1T 字 节 , 等 于 1000 GB, 大 约 是 
1000000000000 个 字符 。 最 近 , 这 个 “机 群 " 变 得 更 加 庞大 。 这 是 一 个 相当 极端 的 例子 , 但 是 每 个 
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大 公司 都 在 Web 上 运行 程序 , 并 通过 它 与 用 户 或 消费 者 进行 交互 。 更 多 的 例子 包括 Amazon( 销售 
图 书 和 其 他 商品 ) 、Amadeus( 航 空 票务 和 汽车 租赁 ) 和 eBay( 在 线 拍卖 )。 数 以 百 万 计 的 小 公司 、 
组 织 和 个 人 也 存在 于 Web 上 。 它 们 中 的 大 多 数 并 不 运行 自己 的 软件 , 但 是 也 有 很 多 在 运行 并 且 
相当 复杂 。 

其 他 更 传统 、 更 大 规模 的 计算 机 应 用 主要 涉及 : 会 计 、 订 单 处 理 、 发 薪水 、 记 录 保 存 、 账 单 、 
库存 管理 、 个 人 记录 、 学 生 记录 、 病 历 等 , 基本 上 每 个 组 织 都 需要 保存 记录 (商业 和 非 商业 、 政 府 
和 个 人 ) 。 这 些 记录 是 每 个 组 织 的 支柱 。 通 过 计算 机 处 理 这 些 记录 看 起 来 很 简单 : 这 些 信息 ( 记 
录 ) 中 的 大 多 数 只 需要 存储 和 检索 ， 只 有 非常 少 的 部 分 需要 处 理 。 这 方面 的 例子 主要 包括 : 

12: 30 飞 往 芝加哥 的 航班 是 否 仍然 准时 ? 

Gilbert Sullivan 是 否 曾 经 患 过 麻疹 ? 

Juan Valdez 订购 的 咖啡 是 否 已 经 局 运 ? 

Jack Sprat 在 1996 年 购买 的 是 哪 种 餐 椅 ? 

2006 年 8 月 从 212 区 号 拨 出 电话 的 数量 是 多 少 ? 

1 月 售 出 的 咖啡 壹 数量 和 总 价 是 多 少 ? 

规模 庞大 的 数据 库 使 得 这 些 系 统 非常 复杂 。 这 样 ， 就 对 响应 时 间 ( 对 每 个 查询 的 响应 通常 不 超过 
2 秘 钟 ) 和 准确 性 (至 少 在 大 多 数 情 况 下 ) 的 需求 。 如 今 , 人 们 谈论 T 字 节 的 数据 (一 个 字 节 等 于 用 
于 存储 一 个 普通 字符 的 内 存 大 小 ) 已 经 很 常见 了 。 这 就 是 传统 的 “数据 处 理 ”, 它 正在 和 “Web” 相 
融合 , 这 是 由 于 当前 多 数 的 数据 库 访 问 都 通过 Web 接口 。 

这 种 计算 机 应 用 通常 称 为 信息 处 理 。 它 将 重点 集中 在 数据 上 , 通常 是 大 量 的 数据 。 这 就 导致 
了 在 数据 的 组 织 和 传输 上 的 挑战 , 以 及 在 怎样 以 可 以 理解 的 形式 来 表示 大 量 数据 的 大 量 有 趣 的 工 
作 :“ 用 户 接口 ”是 处 理 数据 中 的 重要 方面 。 例 如 ， 对 古典 文学 ( Chaucer 的 《Canterbury Tales》 或 
Cervantes 的 《Don Quixote》 ) 的 分 析 工作 , 通过 比较 几 十 个 版 本 以 找 出 哪个 才 是 作者 的 实际 创作 。 
我 们 需要 以 分 析 人 员 提 供 的 多 种 标准 来 搜索 文本 , 并 且 以 有 助 于 发 现 要 点 的 方式 来 显示 结果 。 思 
考 一 下 文本 分 析 和 出 版 : 当前 , 几乎 所 有 的 文章 、 书 籍 、 小 册子 、 报 纸 等 都 通过 计算 机 生产 。 设 计 
出 能 够 很 好 地 支持 这 一 切 的 软件 , 对 大 多 数 人 仍 是 一 个 缺乏 真正 好 的 解决 方案 的 问题 。 

1.5.6 一 种 垂直 的 视角 

有 人 曾经 宣布 古生物 学 家 可 以 重 构 一 个 完整 的 恐龙 , 并 且 通 过 研究 一 块 小 的 骨骼 来 描述 它 的 
生活 方式 和 自然 环境 。 这 有 可 能 是 一 种 夸张 的 说 法 , 但 是 从 中 可 以 体会 到 通过 观察 一 个 简单 的 产 
品 来 思考 它 的 含义 的 思想 。 我 们 考虑 一 下 这 张 显 示 火 星 风 景 的 照片 , 它 由 NASA 的 火星 探测 器 扒 
带 的 照相 机 所 拍摄: 





如 果 你 希望 研究 “火箭 科学 ”, 那么 成 为 好 的 程序 员 是 一 种 方式 。 各 种 空间 计划 需要 大 量 软件 设计 
人 员 , 特别 是 根据 载 人 或 非 载 人 空间 计划 需要 的 懂得 物理 、 数 学 、 电 子 工程 、 机 械 工程 、 医 疗 工程 
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等 的 人 员 。 人 类 已 成 功 发 射 两 颗 探 测 器 围绕 火星 运行 四 年 多 (估计 的 设计 寿命 是 3 个 月 ) , 这 是 人 
类 文明 最 伟大 的 成 就 技术 之 一 。 

这 张 照片 通过 一 条 通信 信道 经 过 单 向 .25 分 钟 的 传输 延 时 传输 到 地 球 , 这 里 需要 很 多 巧妙 的 
编程 和 高 等 数学 应 用 ,以 便 保证 以 最 少 的 比特 数 、 同 时 无 差错 地 传输 图 片 。 在 地 球 上 , 通过 某 些 
算法 对 这 张 照 片 进 行 泻 染 以 恢复 颜色 和 减 小 失真 , 这 些 问 题 都 是 由 光学 和 电子 传感器 引起 的 。 

火星 探测 器 的 控制 程序 当然 也 是 程序 , 探测 器 每 24 小 时 会 自动 驱动 一 次 , 执行 前 一 天 从 地 球 
发 送 的 指令 。 数 据 传输 也 是 由 程序 来 管理 的 。 

探测 器 中 的 各 种 计算 机 使 用 的 操作 系统 、 传 输 和 照片 重 构 都 是 程序 ， 在 这 点 上 和 用 来 编写 本 
章 的 各 种 应 用 程序 相似 。 运 行 这 些 程序 的 计算 机 是 通过 CAD/ZCAM (计算 机 辅助 设计 和 计算 机 辅 
助 制造 程序 来 设计 和 生产 的 。 这 些 计 算 机 中 的 芯片 是 通过 计算 机 化 生产 线 用 精密 工具 组 装 的 ， 
这 些 工 具 在 它们 的 设计 和 制造 中 也 使 用 计算 机 (或 软件 ) 。 对 这 个 长 期 组 装 过 程 的 质量 监控 涉及 
大 量 计算 。 所 有 这 些 代码 都 由 程序 员 用 高 级 编程 语言 编写 , 并 且 通 过 编译 器 (本 身 就 是 一 个 程序 ) 
转换 成 机 器 代码 。 很 多 程序 使 用 GUI 与 用 户 进 行 交 互 , 以 及 使 用 输入 /输出 流 进行 数据 交换 。 

最 后 , 在 图 像 处 理 ( 包括 来 自 火 星 探 测 器 的 照片 处 理 )、 动 画 和 照片 编辑 (在 网 络 上 有 很 多 描 
述 围 绕 “ 火 星 ” 的 探测 器 照片 ) 方 面 也 需要 大 量 编程 工作 。 

1.5.7 与 C++ 程序 设计 有 何 联系 

这 些 “ 多 样 和 复杂 的 ?应 用 和 软件 系统 与 学 习 编 程 和 使 用 C++ 有 什么 关系 ? 这 个 关系 很 简 
单 , 很 多 程序 员 会 参加 这 样 的 项 目 。 这 些 事 是 好 的 程序 设计 可 以 帮助 实现 的 。 本 章 中 用 到 的 每 个 
例子 都 涉及 C++ 和 本 书 中 描述 的 几 种 技术 。 是 的 , 在 MP3 播放 器 、 船 般 、 风 力 发 电机 组 、 火 星 探 
测 和 人 类 基因 工程 中 都 会 用 到 C++ 编程 。 如 果 想 获得 更 多 的 使 用 C++ 的 例子 , 你 可 以 查看 


www. research. att. com/ ~ bs/applications. html。 
1.6 程序 员 的 理想 


我 们 希望 从 自己 的 程序 中 获得 什么 ?我 们 通常 (而 不 是 从 特定 程序 的 特定 功能 ) 希望 获得 什 
么 ? 我 们 希望 保证 正确 性 和 作为 其 中 一 部 分 的 可 靠 性 。 如 果 程 序 没有 按照 设想 工作 , 没有 按 我 们 
可 以 信赖 的 方式 工作 , 小 则 是 一 个 严重 干扰 、 大 则 是 一 个 危险 。 我 们 希望 它 得 到 良好 的 设计 , 这 
样 它 可 以 很 好 地 满足 实际 需要 ; 如 果 它 所 做 的 事情 与 我 们 无 关 , 或 者 以 某 种 我 们 厌烦 的 方式 完 
成 , 则 不 能 说 程序 是 正确 的 。 我 们 同样 希望 可 以 负担 得 起 ; 我 可 能 喜欢 用 Rolls-Royce 汽车 或 行政 
专机 作为 日 常 交通 工具 , 但 是 除非 我 是 一 名 亿 万 富翁 ,否则 开销 会 影响 我 的 选择 。 

这 些 方面 是 软件 (工具 、 系 统 ) 能 得 到 外 部 的 、 非 程序 员 的 赞赏 的 所 在 。 如 果 我 们 希望 开发 出 
成 功 的 软件 , 那么 这 些 内 容 必须 成 为 程序 员 的 理想 , 我 们 必须 将 它们 永远 记 在 心中 , 特别 是 在 程 
序 开发 的 早期 阶段 。 此 外 , 我 们 必须 关注 与 代码 本 身 相 关 的 理想 : 我 们 的 代码 必须 是 可 维护 的 ， 
那些 没有 编写 它 的 人 可 以 理解 它 的 结构 和 进行 修改 。 一 个 成 功 的 程序 可 以 “生存 ”很 长 时 间 ( 通 常 
有 几 十 年 ) 并 经 过 反复 修改 。 例 如 , 它 将 会 移植 到 新 的 硬件 上 , 它 将 会 增加 新 的 功能 , 它 将 会 修改 
以 使 用 新 的 WO 设备 (屏幕 、 视 频 、 音 频 ), 它 将 会 用 新 的 自然 语言 进行 交互 等 。 只 有 失败 的 程序 
才 永 远 不 会 被 修改 。 为 了 保证 可 维护 性 , 一 个 程序 必须 只 与 它 的 需求 相关 , 它 的 代码 必须 直接 体 
现 要 表达 的 思想 。 复 杂 性 是 简单 性 和 可 维护 性 的 敌人 , 它 对 程 来 说 可 能 是 必需 的 (在 那 种 情况 下 
我 们 不 得 不 处 理 它 ), 但 是 也 可 能 是 由 于 没有 用 代码 清晰 地 表达 出 思想 而 产生 。 我 们 必须 通过 良 
好 的 编码 风格 来 尽量 避免 它 一 一 风格 是 很 重要 的 ! 
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这 听 起 来 不 太 难 , 但 是 做 起 来 确实 很 难 。 为 什么 ? 编程 基本 上 是 简单 的 : 就 是 告诉 机 器 你 打 
算 做 什么 。 但 是 ,为 什么 编程 中 要 面 对 很 多 挑战 ? 计算 机 基本 上 是 简单 的 , 它 只 能 做 很 少 几 种 操 
作 , 例如 两 个 数 相 加 和 基于 两 个 数 的 比较 来 选择 要 执行 的 下 一 条 指令 。 问 题 是 我 们 并 不 希望 计算 
机 做 简单 的 事情 。 我 们 希望 机 器 "帮助 我 们 做 那些 难以 完成 的 事 , 但 是 计算 机 是 挑剔 的 、 无 情 的 
和 不 会 说 话 的 东西 。 另 外 , 这 个 世界 要 比 我 们 所 相信 的 更 复杂 ,因此 我 们 并 不 能 理解 自己 需求 的 
实际 含义 。 我 们 只 是 希望 一 个 程序 能 够 “ 像 这 样 做 一 些 事情 ,但 是 我 们 并 不 希望 被 技术 细节 所 困 
扰 。 我 们 通常 假设 “基本 常识 ”。 不 幸 的 是 ， 人 们 认为 很 普通 的 基本 常识 , 在 计算 机 中 通常 完全 不 
存在 (通过 某 些 精心 设计 的 程序 , 可 以 在 具体 的 、 很 好 理解 的 情况 下 模拟 它 ) 。 

这 种 思路 导致 的 想法 是 ”编程 就 是 理解 : 当 你 需要 编写 一 个 任务 时 ,你 需要 理解 它 。 相 反 ， 
当 你 彻底 理解 一 个 任务 , 你 可 以 编写 程序 去 执行 它 。 换 句 话 说 , 我 们 可 以 将 编程 看 做 努力 去 彻底 
理解 一 个 课题 的 一 部 分 。 程 序 是 我 们 对 一 个 课题 的 理解 的 精确 表示 。 

当 你 在 进行 编程 时 ,你 会 花费 很 多 时 间 尝 试 理解 你 试图 自动 化 的 任务 。 

我 们 可 以 将 描述 开发 程序 的 过 程 分 为 四 个 阶段 : 
分 析 : 问题 是 什么 ?用户 想 要 做 什么 ? 用 户 需 要 什么 ?用 户 可 以 负担 什么 ”我们 需要 哪 
种 可 靠 性 ? 
设计 : 我 们 如 何 解决 问题 ? 系统 的 整体 结构 将 是 怎样 的 ? 系统 包括 哪些 部 分 ? 这 些 部 分 
之 间 如 何 通信 ? 系统 与 用 户 之 间 如 何 通 信 ? 
编程 : 用 代码 表达 问题 (或 设计 ) 求 解 的 方法 ,以 满足 所 有 约束 (时 间 、 空 间 、 金钱 、 可 靠 性 
等 ) 的 方式 编写 代码 。 保 证 这 些 代 码 是 正确 的 和 可 维护 的 。 

。 测试 : 系统 化 地 尝试 各 种 况 ,保证 系统 在 所 要 求 的 所 有 情况 下 都 能 正确 工作 。 
编程 和 测试 相 加 通常 称 为 实现 。 很 明显 , 将 软件 开发 简单 分 为 四 个 部 分 是 一 种 简化 。 分 别针 对 这 
四 个 主题 编号 的 书 都 很 厚 , 并 且 很 多 书 仍 在 讨论 它们 之 间 的 关系 。 需 要 说 明 的 一 件 重要 的 事情 是 
开发 的 这 四 个 阶段 并 不 是 独立 的 , 并 且 不 一 定 严 格 按照 顺序 依次 出 现 。 我 们 通常 从 分 析 开 始 , 但 
是 通过 测试 的 反馈 有 助 于 对 编程 的 改进 ; 编程 工作 带 来 的 问题 可 能 表明 设计 带 来 的 问题 ; 按 设计 
进行 工作 可 能 发 现在 设计 中 至 今 仍 被 忽视 的 某 些 方面 的 问题 。 系 统 的 实际 使 用 通常 会 暴露 分 析 
中 的 一 些 弱 点 。 

这 里 的 关键 概念 是 反馈 。 我 们 从 经 验 中 学 习 , 根据 学 到 的 东西 改变 我 们 的 行为 。 这 是 高 效 软 
件 开发 的 根本 。 对 于 很 多 大 的 项 目 , 我 们 在 开始 之 前 不 可 能 理解 有 关 问 题 的 所 有 事情 和 解决 方 
案 。 我 们 可 以 尝试 目 己 的 想法 和 从 编程 中 得 到 反馈 , 但 是 在 开发 的 早期 阶段 更 容易 (更 快 ) 从 设计 
方案 的 书写 、 按 设计 思路 编程 和 朋友 的 使 用 中 得 到 反馈 。 我 们 知道 的 最 好 的 设计 工具 是 黑板 。 你 
要 尽 可 能 避免 独立 设计 。 在 已 将 设计 思路 解释 给 其 他 人 之 前 , 不 要 开始 进行 编码 工作 。 在 接触 键 
盘 之 前 , 与 朋友 、 同事、 潜在 用 户 等 讨论 设计 和 编程 技术 。 从 简单 尝试 到 阐明 思路 的 过 程 中 ,你 
所 学 到 的 东西 是 令 人 惊讶 的 。 最 终 , 程序 只 不 过 是 对 某 些 思路 的 表达 ( 用 代码 ) 。 

同样 ， 当 你 实现 一 个 程序 时 遇 到 问题 , 将 目光 从 键盘 上 移 开 。 考 虑 一 下 问题 本 身 , 而 不 是 你 的 
不 完整 的 方案 。 与 别人 交流 : 解释 你 希望 做 什么 和 为 什么 它 不 工作 。 令 人 惊讶 的 是 , 你 向 有 些 人 详 
细 解 释 问题 的 过 程 中 经 常会 找到 解决 方案 。 除 非 不 得 已 ， 否则 不 要 单独 进行 调试 (找到 程序 错误 ) ! 

本 书 的 重点 是 实现 , 特别 是 编程 。 我 们 不 讲授 “解决 问题 ”， 以 及 提供 有 关 问 题 的 足够 例子 和 
它们 的 解决 方案 。 很 多 问题 的 解决 是 认识 到 一 个 已 知 的 问题 ， 以 及 使 用 一 个 已 知 的 解决 方案 。 只 
有 当 大 多 数 子 问 题 以 这 种 方式 解决 后 ,你 才 可 能 专注 于 令 人 兴奋 的 和 有 创造 性 的 “跳出 固有 模式 
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的 思维 ”。 因 此 , 我 们 重点 介绍 如 何 用 代码 明确 表达 思路 。 

用 代码 直接 表达 思路 是 编程 的 基本 的 理想 。 这 确实 是 很 明显 , 但 是 至 今 我 们 还 缺少 好 的 例 
子 。 我 们 将 会 反复 回 到 这 里 。 当 我 们 需要 在 自己 的 代码 中 使 用 一 个 整数 时 , 我 们 将 它 保 存在 一 个 
int 类 型 中 , 它 会 提供 基本 的 整数 操作 。 当 我 们 需要 使 用 一 个 字符 串 时 , 我 们 将 它 保存 在 一 个 
string 类 型 中 , 它 会 提供 基本 的 文本 控制 操作 。 在 最 基本 的 层次 上 , 理想 是 当 我 们 有 一 个 思路 、 概 
念 和 实体 时 , 即 那些 我 们 可 以 作为 “事情 ?考虑 的 、 可 以 写 在 黑板 上 的 、 可 以 加 入 讨论 的 、( 非 计算 
机 科学 ) 教 科 书 中 讨论 的 东西 , 我 们 需要 这 些 东 西 在 程序 中 作为 一 个 命名 实体 (类 型 ) 存 在 , 并 且 
提供 我 们 需要 它们 执行 的 操作 。 如 果 我 们 需要 进行 数学 计算 , 则 需要 一 个 复数 的 complex 类 型 和 
一 个 线性 代数 的 Matrix 类 型 。 如 果 我 们 需要 进行 图 形 处 理 , 则 需要 一 个 Shape 类 型 、 一 个 Circle 
类 型 、 一 个 Color 类 型 和 一 个 Dialog_box 类 型 。 当 我 们 处 理 来 自 比 如 说 一 个 温度 传感器 的 数据 流 
时 , 我 们 需要 一 个 istream 类 型 (“i” 表 示 输 入 ) 。 很 明显 , 每 种 类 型 将 提供 适当 的 操作 , 并 且 只 提 
供 适当 的 操作 。 这 些 只 是 本 书 中 提 到 的 几 个 例子 。 基 于 上 述 内 容 , 我 们 提供 用 于 构建 自己 的 类 型 
的 工具 和 技术 , 以便 用 程序 直接 表达 你 希望 体现 的 概念 。 

编程 是 实践 和 理论 相 结 合 的 。 如 果 你 只 重视 实践 , 你 将 制造 出 不 可 扩展 的 、 不 可 维护 的 程 
序 。 如 果 你 只 重视 理论 , 你 将 制造 出 无 法 使 用 的 (或 无 法 负担 的 ) 玩 具 。 

如 果 你 想 获 得 有 关 编 程 理想 的 不 同类 型 的 观点 , 以 及 少数 在 编程 语言 方面 对 软件 做 出 重要 和 贡 
献 的 人 , 请 看 第 22 章 “ 理 想 和 历史 ”。 


人 》 思考 是 


思考 题 的 目的 是 说 明 本 章 所 解释 的 关键 思想 。 可 以 把 它们 看 做 是 练习 的 补充 : 练习 关注 的 是 编程 的 实 
践 方面 ,而 思考 题 党 试 帮助 你 阐明 思想 和 概念 。 在 这 方面 , 它们 类 似 于 好 的 面试 题 。 
. 什么 是 软件 ? 

. 软件 为 什么 重要 ? 

.软件 重要 在 哪里 ? 

.如 果 有 些 软件 失败 , 那么 导致 错误 的 原因 是 什么 ? 列举 一 些 例子 。 
. 软件 在 哪里 扮演 重要 角色 ? 列举 一 些 例子 。 

， 哪些 工作 与 软件 开发 相关 ? 列举 一 些 例子 。 

. 计算 机 科学 和 编程 之 间 的 区 别 是 什么 ? 

. 在 船舶 的 设计 、 建 造 和 使 用 中 , 软件 使 用 在 哪些 地 方 ? 
.什么 是 服务 器 机 群 ? 

. 你 在 线 提出 哪 种 类 型 的 查询 ?列举 一 些 例子 。 

. 软件 在 科学 方面 有 哪些 应 用 ? 列举 一 些 例子 。 

. 软件 在 医疗 方面 有 哪些 应 用 ? 列举 一 些 例子 。 

.软件 在 娱乐 方面 有 哪些 应 用 ? 列举 一 些 例子 。 

. 我 们 期 待 中 的 好 软件 的 一 般 特点 有 哪些 ? 

一 个 软件 开发 者 看 起 来 像 什么 ? 

.软件 开发 有 哪些 阶段 ? 

. 软件 开发 为 什么 困难 ? 列举 一 些 原因 。 

. 软件 的 哪些 用 途 为 人 类 生活 带 来 便利 ? 

19. 软件 的 哪些 用 途 为 人 类 生活 带 来 更 多 困难 ? 


过》 术语 


这 些 术 语 是 编程 和 C++ 方面 的 基本 词汇 。 如 果 你 希望 理解 人 们 谈 到 的 关于 编程 的 主题 和 阐明 自己 的 思 
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路 , 那么 你 应 该 知道 每 个 术语 的 含义 。 


负担 得 起 客户 程序 员 ”分 析 设计 程序 设计 

黑板 反馈 ”软件 CAD/CAM “图 形 用 户 界面 (GUIT) 陈规 旧 习 

沟通 理想 测试 正确 性 实现 用 户 
>》 习题 


1. 选择 一 种 你 最 常 做 的 活动 (例如 上 学 、 吃 饭 或 看 电视 )。 列 举 计 算 机 直接 或 间接 参与 其 中 的 方式 。 

2. 选择 一 种 你 最 感 兴趣 或 了 解 的 职业 。 列 举 这 些 职业 的 人 涉及 计算 机 的 活动 。 

3. 将 你 从 习题 2 中 得 到 的 列表 与 选择 不 同 职业 的 朋友 交换 , 并 且 改 进 他 或 她 的 列表 。 当 你 完成 这 个 练习 ， 
比较 你 们 的 结果 。 记 住 , 这 种 开放 式 的 练习 没有 完美 的 解决 方案 , 永远 有 可 能 需要 改进 。 

4. 根据 你 自己 的 经 验 , 描述 一 种 离开 计算 机 不 可 能 进行 的 活动 。 

5. 列举 你 已 经 使 用 过 的 程序 (软件 应 用 ) 。 列 举 那些 你 与 程序 有 明显 交互 的 例子 (例如 在 一 台 MP3 播放 器 中 
选择 一 首 新 歌 ) ， 而 不 是 那些 可 能 涉及 计算 机 的 例子 ( 例如 转动 你 的 汽车 方向 盘 ) 。 

6. 列举 十 种 完全 不 会 涉及 ( 即使 是 间接 的 ) 计算 机 的 人 类 活动 。 这 可 能 会 比 你 想象 得 更 难 。 

7. 列举 五 个 当前 没有 使 用 计算 机 , 但 是 你 认为 在 将 来 会 使 用 的 任务 。 为 你 选择 的 每 个 任务 写 几 名 话 加 以 说 明 。 

8. 解释 (至 少 100 字 , 但 不 超过 500 字 ) 为 什么 你 想 成 为 一 名 计算 机 程序 员 。 另 一 方面 , 如 果 你 认为 自己 不 
想 成 为 一 名 程序 员 , 请 解释 原因 。 在 这 两 种 情况 下 ， 提 供 深思 熟 虑 、 合 乎 逻辑 的 论据 。 

9. 解释 (至少 100 字 , 但 不 超过 500 字 ) 除 了 程序 员 之 外 ,你 希望 在 计算 机 工业 中 扮演 的 角色 (“程序 员 ” 是 
否 是 你 的 首要 选择 ) 。 

10. 你 认为 计算 机 将 会 发 展 到 有 意识 、 有 思想 、 有 能 力 与 人 类 竞争 的 程度 吗 ? 写 一 段 支持 你 的 观点 的 话 (至 
少 100 字 ) 。 

11. 列举 最 成 功 的 程序 员 共 有 的 特点 。 列 举 通 常 认为 程序 员 应 该 具有 的 特点 。 

12 列举 五 种 在 本 章 中 提 到 的 对 计算 机 程序 的 应 用 ， 并 选择 一 种 你 最 感 兴趣 和 将 来 最 想 参加 的 应 用 。 并 角 
释 为 什么 选择 这 种 应 用 (至 少 100 字 ) 。 

13. 保存 本 页 文字 、 本 章 、 莎 士 比 亚 的 所 有 著作 各 需要 多 大 内 存 ? 假设 1 字 节 的 内 存 可 以 保存 一 个 字符 , 在 
这 里 只 是 尽量 精确 到 20% 。 

14. 你 的 计算 机 拥有 多 大 的 内 存 ? 主 存储 器 多 大 ? 磁盘 多 大 ? 


人 附 言 

我 们 的 文明 运行 在 软件 之 上 。 软 件 是 一 种 有 趣 的 、 对 社会 有 益 的 、 有 利 可 图 的 工作 , 它 是 具有 无 与 伦比 
的 多 样 性 和 机 会 的 领域 。 当 你 接触 软件 时 , 以 有 原则 和 严肃 的 方式 工作 : 你 要 成 为 解决 方案 的 一 部 分 , 而 不 
是 增加 问题 。 

我 们 对 贯穿 技术 文明 的 各 种 软件 很 敬 避 。 当 然 , 软件 并 不 是 在 所 有 应 用 中 都 表现 良好 , 但 那 是 另外 一 
回 事 。 在 这 里 , 我 们 想 强 调 的 是 软件 是 多 么 普遍 ， 以 及 我 们 在 日 常生 活 中 多 么 依赖 软件 。 它 们 都 是 由 像 我 
们 这 样 的 人 来 编写 的 。 所 有 的 科学 家 、 数 学 家 、 工 程 师 、 程序 员 等 , 他 们 构建 这 里 简略 提 到 的 软件 的 起 点 和 
你 是 一 样 的 。 

现在 , 让 我 们 回 到 脚踏实地 的 业务 上 , 学 习 那 些 编程 需要 的 技术 性 的 技能 。 如 有 果 你 开始 怀疑 自己 艰 兰 
工作 是 否 值得 (大 多 数 深思 熟 虑 的 人 有 时 会 怀疑 它 ), 你 可 以 返回 并 重新 阅读 本 章 、 前 言 和 第 0 章 。 如 果 你 
开始 怀疑 自己 是 否 能 掌握 这 一 切 , 请 记 住 已 经 有 数 百 万 人 成 为 称职 的 程序 员 、 设计 师 、 软 件 工 程 师 等 。 你 也 
可 以 做 到 。 





第 2 章 Hello， Worldi 


“程序 设计 要 通过 编写 程序 的 实践 来 学 习 ” 


-一 一 Bnan Kernighan 


在 本 章 中 , 我 们 提出 最 简单 的 C++ 程序 , 它们 实际 上 可 以 做 任何 事 。 编 写 这 些 程序 的 目的 如 下 : 

。 让 你 试用 自己 的 编程 环境 。 

。 给 你 一 个 最 初 的 体验 : 如 何 让 计算 机 为 你 做 某 些 事 。 

因此 , 我 们 提出 程序 的 概念 , 使 用 编译 器 将 程序 从 人 类 可 读 的 形式 转换 到 机 器 指令 , 以 及 最 
终 执行 机 器 指令 的 思想 。 


2.1 程序 


为 了 使 计算 机 能 够 做 某 件 事 , 你 (或 其 他 人 ) 需 要 在 繁琐 的 细节 上 明确 告诉 它 怎么 做 。 对 “ 怎 
么 做 "的 描述 称 为 程序 ,编程 是 书写 和 测试 这 个 程序 的 行为 。 

在 某 种 意义 上 , 我 们 以 前 都 编写 过 程序 。 毕 竟 , 我 们 曾 描述 过 所 要 完成 的 任务 , 例如 “如 何 开 
车 去 最 近 的 电影 院 ”"、“ 如 何 找 到 楼 上 的 浴室 ”和 “如 何 用 微波 炉 热 饭 ”。 这 种 描述 和 程序 之 间 的 不 
同 表现 在 精确 度 上 : 人 类 往往 通过 常识 对 不 明确 的 指示 加 以 补偿 , 但 是 计算 机 不 会 这 样 。 例 如 ， 
“ 沿 走廊 右 转 ， 上 楼 , 它 就 在 你 的 左边 ”可 能 是 对 如 何 找 到 楼 上 的 浴室 的 很 好 描述 。 但 是 ， 当 你 看 
到 这 些 简单 的 指令 时 , 你 会 在 其 中 找到 草率 的 语法 和 不 完整 的 指令 。 人 类 很 容易 做 出 补偿 。 例 
如 , 假设 你 坐 在 桌子 旁 询问 浴室 的 方向 。 你 不 需要 被 告知 离开 桌子 来 到 走廊 、 绕 过 (不 是 跨 过 或 
凶 过 ) 果 子 、 不 要 躁 到 猫 等 。 你 不 需要 被 告知 不 要 带 走 刀子 和 叉子 ,以 及 记 住 打 开 灯 才能 看 到 楼 
梯 。 你 也 不 需要 被 告知 进入 浴室 之 前 首先 要 开门 。 

与 此 相反 , 计算 机 确实 是 不 很 条 的。 它们 做 的 所 有 事 都 要 准确 、 详 细 地 描述 。 我 们 考虑 “ 沿 
走廊 右 转 , 上 楼 , 它 就 在 你 的 左边 ” 。 走 廊 在 哪里 ? 什么 是 走廊 ?什么 是 “ 右 转 ”? 什么 是 楼 梯 ? 
我 如 何 上 楼 梯 ? 〈 每 次 迈 出 一 步 ? 两 步 ? 沿 扶手 滑 上 楼 梯 ?) 什么 是 我 的 左边 ? 它 什 么 时 候 会 在 我 
的 左边 ? 为 了 同 计算 机 精确 描述 这 些 “ 事 情 ”, 我 们 需要 一 种 由 特定 语法 精确 定义 的 语言 (英语 对 
它 来 说 有 太 多 的 松散 结构 ) 和 针对 我 们 要 执行 的 多 种 行动 明确 定义 的 词汇 。 这 种 语言 称 为 编程 语 
言 , C++ 是 为 各 种 编程 任务 而 设计 的 编程 语言 。 

如 果 你 想 知 道 有 关 计 算 机 、 程序 和 编程 的 更 多 哲学 上 的 细节 , 请 阅读 第 1 章 。 在 这 里 , 让 我 
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们 来 看 一 些 代码 , 从 一 个 很 简单 的 程序 和 运行 它 的 工具 和 技术 开始 学 习 。 
2.2 经 典 的 第 一 个 程序 
这 是 经 典 的 第 一 个 程序 的 一 个 版 本 。 它 在 你 的 屏幕 上 输出 “Hello, World!”: 


/This program outputs the message “Hello, World!” to the monitor 
#include "std_lib_facilities.h" 


int main() /C++ programs start by executing the function main 
{ 
cout << "Hello, Worldi\n";  //output “Heilo, World!” 
return 0; 


} 
我 们 可 以 将 这 段 文字 看 做 是 交 给 计算 机 执行 的 一 组 指令 , 就 像 我 们 交 给 一 个 厨师 的 一 张 菜谱 , 或 
我 们 用 于 使 一 个 新 玩具 工作 的 一 组 指令 集合 。 我 们 从 这 下 面 行 开始 讨论 这 个 程序 的 每 行 如 何 工作 。 


cout << "Hello, Worldi\n";  // output “Hello, World!” 

这 是 实际 生成 输出 内 容 的 一 行 。 它 打印 字符 串 Hello，World1, 并 且 紧 跟 换 一 个 新 行 。 也 就 是 
说 , 在 打印 出 Hello, World! 之 后 , 光标 将 位 于 下 一 行 的 开始 位 置 。 光 标 是 一 个 小 的 、 内 烁 的 字符 
或 行 ， 它 用 来 显示 你 可 以 输入 下 一 个 字符 的 位 置 。 

在 C++ 中 , 字符 串 常量 是 由 双 引 号 (" ) 来 分 隔 。 也 就 是 说 ,“Hello，World! \n” 是 一 个 字符 
串 。\n 是 一 个 用 于 指定 新 行 的 “特殊 字符 ”"。 名 称 cout 是 一 个 标准 的 输出 流 。 使 用 输出 操作 符 
<<“ 放 入 cout” 的 字符 将 显示 在 屏幕 上 。 名 称 cout 的 发 音 是 “see-out”, 它 是 “character output 
stream” 的 缩写 。 你 会 发 现在 编程 时 缩写 很 常见 。 很 自然 , 在 你 第 一 次 看 到 和 要 记 住 一 个 缩写 时 会 
觉得 有 点 儿 烦 , 但 是 当 你 开始 重复 使 用 一 个 缩写 时 ,它们 将 会 变 得 很 自然 , 并 且 对 保持 程序 文本 
的 简短 和 可 控制 是 必 不 可 少 的 。 

这 行 的 结尾 

// output “Hello, World!” 

是 一 个 注释 。 在 一 行 中 的 // 符 号 (/ 符 号 称 为 “ 斜 杜 ”, 这 里 是 两 个 斜 杠 ) 之 后 的 内 容 都 是 注释 。 注 
释 会 被 编译 器 忽略 , 但 对 人 们 读 懂 代码 很 有 帮助 。 在 这 里 , 我 们 使 用 注释 告诉 你 这 一 行 的 开始 部 
分 实际 在 做 什么 。 

注释 用 于 描述 这 个 程序 打算 做 的 事情 , 它 通 常 提供 的 是 对 人 们 有 用 但 是 不 能 用 代码 直接 来 表 
达 的 信息 。 当 你 在 下 一 星期 或 下 一 年 回 过 头 来 阅读 代码 , 并 且 已 经 忘记 为 什么 以 这 种 方式 编写 代 
码 时 , 你 最 有 可 能 通过 代码 中 的 注释 得 到 帮助 。 因 此 , 做 好 你 的 程序 的 文档 工作 。 在 7.6.4 节 ， 
我 们 将 讨论 如 何 做 好 注释 。 

程序 是 为 两 个 读者 编写 的 。 理 所 当然 , 我 们 编写 代码 是 为 了 在 计算 机 中 执行 。 然 而 , 我 们 阅 
读 和 修改 代码 也 花费 很 长 时 间 。 于 是 , 程序 员 是 程序 的 男 一 个 读者 。 因 此 , 编写 代码 也 是 人 与 人 
之 间 沟 通 的 一 种 方式 。 实 际 上 , 考虑 将 人 类 作为 我 们 的 代码 的 主要 读者 是 有 意义 的 : 如 果 他 们 
(我 们 ) 发 现代 码 不 是 那么 容易 理解 , 那么 代码 永远 不 可 能 变 得 正确 。 总 而 言 之 , 注释 只 是 对 人 类 
读者 有 帮助 的 , 计算 机 并 不 会 看 注释 中 的 文本 。 

这 个 程序 中 的 第 一 行 是 一 个 典型 的 注释 ， 它 简 单 地 告诉 人 类 读者 程序 打算 做 什么 : 

/This program outputs the message “Hello, World!” to the monitor 
由 于 这 有 段 代码 本 身 说 明了 程序 做 什么 ,而 不 是 我 们 想 让 它 做 什么 , 因此 这 个 注释 是 有 用 的 。 我 们 通 
常 向 人 类 (粗略 地 ) 解 释 一 个 程序 将 做 什么 ， 比 我 们 用 代码 向 计算 机 (详细 ) 表 达 它 要 简单 得 多 。 这 种 
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注释 通常 是 我 们 编写 的 程序 的 第 一 部 分 。 如 果 没 有 其 他 内 容 , 它 会 提醒 我 们 正在 尝试 做 什么 。 

下 一 行 

#include "std_lib_facilities.h” 
是 一 个 “ 提 nclude 指令 ”。 它 指示 计算 机 从 名 为 std_lib_facilities. h 的 文件 中 提供 (“包含 ”) 功能。 我 们 
编写 这 个 文件 以 简化 使 用 所 有 C++ 实现 (“C++ 标 准 库 ”) 中 的 功能 。 我 们 将 随 着 学 习 的 深入 解释 它 
的 内 容 。 它 完全 是 普通 的 标准 C++ 程序 , 但 是 它 包含 我 们 不 得 不 介绍 的 细节 , 在 后 续 章 中 将 会 介绍 
它们 。 对 于 这 个 程序 来 说 ,std_lib_facilities. h 的 重要 性 表现 在 我 们 可 以 使 用 标准 C++ 流 IO 功能 。 
在 这 里 , 我 们 只 使 用 标准 输出 流 cout 和 它 的 输出 操作 符 << 。 使 用 #include 包含 的 文件 通常 有 
后 缀 .hh, 称 为 头 或 头 文 件 。 在 头 文件 中 包含 术语 的 定义 , 例如 在 我 们 的 程序 中 使 用 的 cout。 

一 台 计 算 机 如 何 知道 从 哪里 开始 执行 一 个 程序 ? 它 会 查找 一 个 称 为 main 的 函数 , 并且 在 那 

里 开始 执行 找到 的 指令 。 下 面 是 ”Hello，World!1” 程 序 的 main 函数 : 


int main() //C++ programs start by executing the function main 
{ 
cout << "Hello, Worldi\n";  // output “Hello, World!” 
return 0; 


} 
-dd C++ 程序 必须 有 一 个 称 为 main 的 国 数 ， 以 便 告 诉 计 算 机 从 哪里 开始 执行 。 一 个 函数 基本 上 
一 个 命名 过 的 指令 序列 ,计算 机 会 按照 它们 的 编写 顺序 来 执行 。 一 个 函数 包括 4 个 组 成 部 分 : 
e 返回 值 类 型 , 在 这 里 是 int( 表示” 整数 ”), 它 用 来 指定 返回 结果 的 类 型 。 如 果 有 的 话 ， 这 
个 函数 会 将 值 返回 给 要 求 它 执行 的 程序 。 单 词 int 在 C++ 中 是 保留 字 ( 一 个 关键 字 ) ， 因 
此 int 不 能 用 于 作为 其 他 任何 东西 的 名 字 ( 见 A.3.1 节 )。 
se 名字, 在 这 里 是 main。 
e 参数 列表 ,封闭 在 一 对 括号 中 ( 见 8.2 节 和 8.6 节 ), 在 这 里 是 ( ), 在 这 种 情况 下 , 参数 列 


表 是 空 的 。 
e 函数 体 , 封闭 在 一 对 大 括号 中 , 在 这 里 是 1 中, 列 出 了 这 个 函数 将 要 执行 的 动作 ( 称 为 语句 ) 。 
下 面 是 最 简单 的 C++ 程序 
int main(}) { } 


由 于 这 个 程序 没有 做 任何 事情 ,因此 它 并 没有 什么 用 处 。 我 们 的 “Hello，World1” 程 序 的 main 
()(“ 主 函数 ”) 体 中 有 两 条 语句 ; : 


cout << "Hello, Worldi\n”; // output “Hello, World!” 
return 0; 


首先 , 它 在 屏幕 上 书写 Hello，World!, 然后 返回 一 个 值 0( 零 ) 给 它 的 调用 者 。 由 于 main( ) 是 由 
“系统 "来 调用 的 , 因此 我 们 不 会 使 用 返回 值 。 但 是 , 在 有 些 系统 (特别 是 UNIX/Linux) 中 , 返回 值 
可 以 用 于 检查 程序 是 否 成 功 。 由 main( ) 返回 的 一 个 零 (0) 表 示 程 序 成 功 终止 。 

在 C++ 程序 中 用 于 指定 一 个 行为 并 且 不 是 一 个 #include 指令 (或 其 他 预 处 理 器 指令 ， 见 4.4 
节 和 A.17 节 ) 的 部 分 称 为 语句 。 


2.3 编译 


C++ 是 一 种 编译 语言 。 这 意味 着 要 想 使 一 个 程序 可 以 运行 , 你 首先 必须 将 它 从 人 类 可 读 的 格 
式 转换 为 机 器 可 以 “理解 ”的 东西 。 这 个 转换 过 程 由 一 一 个 称 为 编译 器 的 程序 来 做 。 你 可 以 读 或 写 
的 称 为 源 代 码 或 程序 文本 ， 计 算 机 可 以 执行 的 称 为 可 
执行 代码 、 目 标 代码 或 机 器 代码 。 典 型 的 C++ 源 代 
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码 文件 的 后 缀 为 . cpp( 例 如 hello_world. cpp) 或 .h( 例 如 std_lib_facilities. h), 目标 代码 文件 的 后 缀 
为 . obj( 在 Windows 中 ) 或 .o( 在 UNIX 中 ) 。 代 码 一 词 是 模棱两可 的 并 且 会 引起 混淆 , 注意 只 有 在 
可 以 明确 表达 含义 时 才 使 用 它 。 除 非特 别 说 明 , 否则 我 们 用 代码 来 表示 “ 源 代码 "或 “不 包含 注释 
的 源 代码 ”, 这 是 由 于 注释 只 是 供 人 类 阅读 的 , 在 编译 器 生成 目标 代码 时 不 会 看 到 它 。 

编译 需 会 阅读 你 的 源 代 码 , 并 且 尽 力 理解 你 所 写 的 内 容 。 编 译 器 会 检查 你 的 程序 在 语法 上 是 
否 正确 , 每 个 单词 是 否 已 明确 定义 , 在 程序 中 是 否 有 不 必 实 际 执 行 就 可 以 检测 到 的 明显 错误 。 你 
会 发 现 编译 器 在 语法 上 相当 挑剔。 忽略 程序 中 的 有 些 细节 (例如 厅 nclude 文件 、 分 号 或 大 括号 ) 将 
会 引起 错误 。 与 此 类 似 , 编译 回 绝对 不 会 容忍 拼写 错误 。 我 们 将 通过 一 系列 例子 来 解释 这 些 , 在 
每 个 例子 中 有 一 个 小 错误 。 每 个 错误 是 我 们 经 党 犯 的 一 类 错误 的 例子 : 


/no #include here 
int main() 
{ 
cout << "Hello, Worldi\n’; 
return 0; 
} 
我 们 没有 包括 任何 文件 以 告诉 编译 器 cout 是 什么 , 因此 编译 器 会 抱怨 。 为 了 纠正 这 个 错误 , 增加 
一 个 头 文件 
#include "std_ facilities.h" 
int main() 
{ 
cout << "Hello, World!\n"; 
return 0; 


} , 
不 幸 的 是 , 编译 器 再 次 抱怨 : 我 们 拼写 错 了 std_lib_facilities. h。 编 译 器 也 不 支持 这 样 : 


#include "std lib facilities.hy 
int main() 
{ 
cout << "Hello, Worldi\n; 
return 0; 


} 
我 们 没有 用 一 个 "来 终止 字符 串 。 编 译 器 也 不 支持 这 样 : 


#include "std_jib_facilities.hs 
integer main() 
{ 
cout << "Hello, Worldi\n"; 
return 0; 


} 
在 C++ 中 使 用 缩写 int 而 不 是 单词 integer。 编 译 器 也 不 支持 这 样 : 


#include "std lib facilities.hr 
int main() 
{ 
cout < "Hello, Worldi\n"; 
return 0; 


} 
我 们 使 用 < (小 于 操作 符 ) 而 不 是 << (输出 操作 符 )。 编 译 器 也 不 支持 这 样 : 


#include "std lib facilities.h" . 
int main() . 


cout << 'Hello, Worjdi\n’'; 
return 0; 
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我 们 使 用 单 引 号 而 不 是 双 引 号 来 限制 字符 串 。 最 后 , 编译 器 发 现 这 样 的 错误 : 
#include "std_iib_facilities.hy 
int main() 


cout << "Hello, Worldi\n’ 
return 0; 


} 

我 们 忘记 使 用 分 号 来 终 目 输出 语句 。 需 要 注意 的 是 , 很 多 C++ 语 句 是 用 一 个 分 号 ( ;) 来 终止 的 。 
编译 器 通过 这 些 分 号 来 识别 一 个 语句 在 哪里 终止 , 以 及 另 一 个 语句 从 哪里 开始 。 这 里 没有 简短 
的 、 完 全 正确 的 、 非 技术 方式 的 有 关 哪 里 需要 分 号 的 总 结 。 现 在 , 我 们 只 是 复制 自己 的 应 用 模式 ， 
它 可 以 归纳 为 : 在 每 个 没有 由 右 侧 大 括号 (| ) 表示 结束 的 表达 式 后 面 放置 一 个 分 号 。 

为 什么 我 们 要 花费 篇 幅 和 你 宝贵 的 时 间 给 你 看 这 些 带 有 琐碎 错误 的 小 程序 的 例子 呢 ? 像 所 
有 的 程序 员 一 样 ,你 会 花费 大 量 时 间 在 程序 源 文本 中 查找 错误 。 在 大 多 数 时 候 , 我 们 看 到 的 是 含 
有 错误 的 文本 。 毕 竟 , 如 果 我 们 确信 一 些 代码 是 正确 的 , 那么 我 们 通常 会 看 其 他 代码 或 将 时 间 用 
在 别 的 地 方 。 这 令 早 期 的 计算 机 先驱 们 非常 惊讶 , 他 们 曾经 不 得 不 花费 自己 的 绝 大 部 分 时 间 来 发 
现 编程 时 产生 的 错误 。 这 也 令 大 多 数 的 编程 新 手感 到 惊讶 。 

当 你 编程 时 ， 有 时 会 对 编译 占 感 到 相当 尾 恼 。 有 时 候 , 编译 器 会 抱怨 无 关 紧 要 的 细节 (例如 
缺少 一 个 分 与 ) ,或 者 一 些 你 认为 明显 正确 "的 东西 。 但 是 ,编译 器 通常 是 正确 的 : 当 它 给 出 一 
个 第 误 消息 并 拒绝 为 你 的 源 代码 生成 目标 代码 时 , 在 你 的 程序 中 确实 有 不 正确 的 地 方 , 这 意味 着 
你 写 的 程序 不 符合 C++ 标准 的 精确 定义 。 

编译 融 没 有 妆 识 ( 它 不 是 人 类 ), 它 对 细节 是 非常 挑剔 的 。 由 于 编译 吉 没 有 常识 , 因此 你 不 能 
让 它 尝 试 着 去 猜测 那些 “看 起 来 正确 ”但 是 不 符合 C++ 定义 的 代码 所 表达 的 意思 。 如 果 你 这 样 做 
并 且 编 译 器 的 猜测 与 你 不 同 , 这 时 你 需要 花费 很 多 时 间 找 出 为 什么 程序 没有 按 你 的 要 求 工 作 。 当 
所 有 的 事 都 说 清和 做 到 后 ， 编 译 器 会 帮 你 从 大 量 自己 造成 的 问题 中 解脱 出 来 。 编 译 器 将 我 们 从 问 
题 中 拖 救 出 来 ,而 不 是 引起 问题 。 因 此 , 请 大 家 记 住 , 编译 器 是 你 的 朋友 , 编译 器 可 能 是 你 在 编 
程 时 最 好 的 朋友 。 : z 


2.4 链接 


程序 通常 由 几 个 单独 的 部 分 组 成 , 它们 经 常 由 不 同 的 人 来 开发 。 例 如 ,，“Hello,，Word1” 程 序 包 
含 我 们 编号 的 部 分 和 C++ 标准 类 库 。 这 些 单独 的 部 分 (有 时 称 为 翻译 单元 ) 必须 被 编译 , 其 目标 代 
0 用 于 将 这 些 部 分 链接 起 来 的 程序 通常 称 为 链接 器 。 
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请 注意 目标 代码 和 可 执行 程序 是 不 能 在 系统 之 间 移 植 的 。 例 如 ， 当 你 为 一 台 Windows 机 器 进 
行 编译 时 , 你 得 到 的 支持 Windows 的 目标 代码 无 法 在 Linux 机 器 上 运行 。 

诽 是 一 些 代码 的 集合 ,它们 通常 是 由 其 他 人 编写 的 ,我 们 用 机 nclude 文件 中 的 声明 来 访问 这 
些 代码 。 声 明 用 于 指出 一 段 程序 如 何 使 用 一 条 语句 , 我 们 将 在 后 面 的 章节 (如 4.5.2 节 ) 中 详细 介 
绍 声 明 。 

由 编译 器 发 现 的 错误 称 为 编译 时 错误 , 由 链接 器 发 现 的 错误 称 为 链接 时 错误 ， 直 到 程序 运行 
时 仍 未 发 现 的 错误 称 为 运行 时 错误 或 逻辑 错误 。 通 常 来 说 , 编译 时 错误 比 链接 时 错误 更 容易 理解 
和 修正 , 链接 时 错误 比 运行 时 错误 和 逻辑 错误 更 容易 发 现 和 修正 。 在 第 5 章 中 , 我 们 将 详细 讨论 
这 些 错误 和 它们 的 解决 方式 。 


2.5 编程 环境 


我 们 使 用 编程 语言 来 编写 程序 。 我 们 使 用 编译 器 将 自己 的 源 代码 转换 成 目标 代码 , 使 用 链接 
器 将 我 们 的 目标 代码 链接 成 一 个 可 执行 程序 。 另 外 , 我 们 使 用 一 些 程序 在 计算 机 中 输入 源 代码 文 
本 并 且 编 辑 它 。 这 些 是 最 初 的 和 最 重要 的 工具 , 它们 构成 程序 员 的 工具 集合 或 “程序 开发 环境 ”。 

如 有 果 你 使 用 的 是 命令 行 窗口 ,就 像 很 多 专业 程序 员 所 做 的 那样 ,你 将 不 得 不 自己 来 编写 编译 
和 链接 命令 。 如 果 你 使 用 IDE(“ 交 互 式 开 发 环境 "或 “集成 式 开发 环境 ”), 就 像 很 多 程序 员 所 做 
的 那样 , 简单 地 点 击 正确 按钮 就 可 以 完成 这 个 工作 。 附 录 C 介绍 了 如 何在 你 的 C++ 实现 中 编译 
和 链接 。 \ 

IDE 通常 包括 一 个 具有 有 用 特性 的 编辑 器 , 例如 用 不 同 颜色 的 代码 来 区 分 你 的 源 代码 中 的 注 
释 、 关 键 字 和 其 他 部 分 , 以 及 其 他 帮助 你 来 调试 代码 、 编 译 和 运行 代码 的 功能 。 调 试 是 发 现 程 序 
中 的 错误 和 排除 错误 的 活动 , 你 在 前 进 的 道路 上 会 听 到 很 多 有 关 它 的 内 容 。 

在 本 书 中 , 我 们 使 用 微软 的 Visual C++ 作为 编程 开发 环境 实例 。 如 果 我 们 简单 地 说 “编译 
器 "或 是 “IDE” 的 某 些 部 分 , 那 就 是 所 指 Visual C++ 系统 。 但 是 , 你 可 以 使 用 一 些 提供 最 新 的 、 符 
合 标准 的 C++ 实现 的 系统 。 我 们 所 说 的 大 多 数 内 容 ( 经 过 微小 的 修改 ) 对 所 有 的 C++ 实现 都 将 是 
正确 的 , 并 且 其 代码 可 以 在 任何 地 方 运行 。 在 工作 中 , 我 们 使 用 几 种 不 同 的 实现 。 


> 简单 练习 


迄今 为 止 , 我们 讨论 了 很 多 有 关 编 程 、 代 码 和 工具 (例如 编译 器 ) 的 内 容 。 现 在 , 你 可 以 运行 一 个 程序 。 
这 是 本 书 中 和 学 习 编程 过 程 中 的 一 个 重点 。 这 是 你 培养 实践 技能 和 好 的 编程 习惯 的 开始 。 本 章 练习 的 重点 
在 于 使 你 熟悉 软件 开发 环境 。 当 你 运行 “Hello，World!1” 程序 时 , 你 将 通过 成 为 程序 员 的 第 一 个 重要 的 里 
程 碑 。 

这 个 简单 练习 的 目的 是 建立 或 加 强 你 的 实际 编程 技能 , 以 及 为 你 提供 编程 环境 工具 方面 的 经 验 。 典 型 
的 简单 练习 是 对 一 个 独立 程序 的 一 系列 修改 , 将 珊 碎 的 程序 发展" 成 一 个 实际 程序 的 有 用 的 部 分 。 一 套 传 
统 的 练习 是 用 于 测试 你 的 主动 性 、 灵 活性 或 创造 性 的 。 与 此 相反 , 简单 练习 很 少 需要 你 发 挥 创造 力 。 典 型 
的 情况 是 顺序 很 关键 ,每 个 单独 的 步骤 可 能 是 容易 (或 琐碎 ) 的 。 请 不 要 上 自 认 为 隆 明 地 试图 跳 过 某 些 步骤 ， 
这 样 通常 会 减 慢 你 的 进展 或 使 你 感到 迷惑 。 

你 可 能 会 认为 自己 已 经 理解 了 阅读 过 的 和 导师 或 辅导 员 告 诉 你 的 任何 事 , 但 是 重复 和 实践 对 提高 编程 
能 力 是 很 必要 的 。 在 这 方面 ,编程 和 体育 、 音 乐 、 舞 中 或 任何 基于 技能 的 行业 是 相似 的 。 请 想象 人 们 试图 经 
过 常规 练习 就 能 在 这 类 领域 中 参与 竞争 ,你 知道 结果 会 如 何 。 坚 持 练习 对 专业 人 员 意 味 着 终身 的 长 期 练习 ， 
是 发 展 和 维持 一 种 高 水 平 的 实用 技能 的 唯一 方式 。 

因此 , 不 要 跳 过 这 个 简单 练习 ,即使 你 多 么 想 跳 过 去 , 它们 从 本 质 上 来 说 是 学 习 的 过 程 。 现 在 ,从 第 一 
步 开始 并 继续 下 去 , 测试 每 个 步骤 以 确保 你 做 得 正确 。 
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如 果 你 不 理解 所 使 用 的 语法 的 细节 也 不 必 担 忧 , 不 要 害怕 向 辅导 员 或 朋友 寻求 帮助 。 坚持 完成 所 有 的 
简单 练习 和 部 分 的 习题 , 所 有 一 切 都 会 在 适当 的 时 候 变 得 清晰 。 

那么 , 这 是 你 的 第 一 个 简单 练习 ; 
1. 查看 附录 C 并 按照 这 些 步骤 的 要 求 建立 一 个 工程 。 建 立 一 个 名 为 hello_world 的 空 日 的 C++ 工程 控制 合 。 
2. 输入 hello_world. cpp, 完全 按照 下 面 的 要 求 , 将 它 保存 在 你 的 练习 目录 中 , 并 将 它 包 含 在 你 的 hello_world 


工程 中 。 
nclude "std lib_facilities.h" 
int main() I C++ programs start by executing the function main 


{ 
cout << "Hello, Worldi\n"; //output “Hello, World!” 
keep_window_open'(); // wait for a character to be entered 
return 0; 

} 


在 一 些 Windows 机 怖 中 需要 调用 keep_window_open( ) ， 以 防止 在 你 在 有 机 会 阅读 输出 之 前 窗口 被 关闭 。 
这 是 Windows 的 一 个 特点 ， 而 不 是 C++ 的 。 我 们 在 std_lib_facilities.h 中 定义 keep_window_open( ) ， 以 便 简 
化 简单 文本 程序 的 编写 。 

你 如 何 找到 std_lib_facilities.h? 如 果 你 在 上 课 , 你 可 以 问 辅导 员 。 否 则 , 你 可 以 从 我 们 的 支持 站 点 
www, stroustrup. com/ Programming 下 载 它 。 但 是 ， 如 果 你 既 没 有 辅导 员 又 无 法 访问 网 站 ? ( 只有) 在 这 种 情况 
下 , 用 下 列 语句 代替 贞 nclude 语句 ， 

#include<iostream> 

#include<string> 

#include<vector> 

#include<algorithm> 

#include<cmath> 


using namespace std; 
inline void keep_window_open() { char ch; cin>>ch; } 


这 里 直接 使 用 了 标准 库 , 它 将 会 跟随 你 直到 第 5 章 , 并 将 在 8.7 节 中 详细 解释 。 

3. 编译 和 运行 " Hello，Wornd! 程序 。 有 些 地 方 很 可 能 不 会 正常 工作 。 很 少 有 人 在 初次 尝试 时 使 用 一 种 新 的 
编程 语言 或 一 个 新 的 编程 环境 时 就 能 成 功 。 找 到 问题 并 修改 它 ! 这 里 的 关键 是 向 一 个 有 经 验 的 人 寻求 帮 
助 , 但 是 你 要 确定 能 够 理解 你 看 到 的 东西 , 这 样 你 在 进一步 处 理 之 前 可 以 完全 自己 来 做 。 

4. 现在 , 你 可 能 遇 到 一 些 铺 误 并 不 得 不 纠正 它 。 现 在 是 更 好 地 熟悉 编译 器 的 错误 发 现 和 错误 报告 功能 的 时 
候 了 ! 尝试 来 自 2.3 节 的 6 个 鲁 误 , 以 便 查看 编程 环境 对 它们 的 反应 。 考 虑 至 少 5 个 可 能 发 生 的 错误 ， 
它们 是 你 在 输入 程序 时 造成 的 (例如 忘记 keep_window_open( ) , 在 输入 单词 时 按 下 Caps Lock 键 , 或 者 将 
分 号 输入 成 喜 号 ), 并 查看 在 编译 和 运行 每 种 错误 时 会 发 生 什么 ? 


人 思考 题 


这 些 思考 题 的 基本 思想 是 给 你 一 个 机 会 ， 以 查看 你 是 否 注 意 到 和 理解 了 本 章 的 关键 点 。 在 回答 问题 时 
你 可 能 需要 返回 正文 中 , 这 是 正常 的 和 可 以 预料 的 。 你 可 能 需要 重新 阅读 整个 章节 , 这 也 是 正常 的 和 可 以 
预料 的 。 但 是 ,如 果 你 需要 重新 阅读 整个 章节 或 对 每 道 思考 题 都 有 问题 , 那么 你 可 能 需要 考虑 自己 的 学 习 
方式 是 否 有 效 。 你 是 否 阅 读 得 过 快 ? 你 可 能 要 停 下 来 并 做 一 下 “ 试 一 试 " 吗 ? 你 会 和 朋友 一 起 学 习 以 讨 论 正 
文 解释 方面 的 问题 吗 ? 
1.“Hello，World! ”程序 的 目的 是 什么 ? 
2， 郴 数 的 4 个 部 分 的 名 字 。 
3， 函 数 命 名 必须 出 现在 每 个 C++ 程序 中 。 
4. 在 “Hello，Word! "程序 中 ， retmim 0; 这 行 的 目的 是 什么 ? 
5. 编译 器 的 目的 是 什么 ? 
6. 丰 nclude 语句 的 目的 是 什么 ? 
7， 文件 名 后 缀 为 .h 在 C++ 中 表示 什么 ? 
8， 链接 器 为 你 的 程序 做 什么 ? 
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9. 源 文件 和 对 象 文件 之 间 的 区 别 是 什么 ? 
10. IDE 是 什么 以 及 它 能 为 你 做 什么 ? 
11. 如 果 你 理解 教材 中 的 所 有 内 容 , 为 什么 练习 还 是 必要 的 ? 

大 多 数 的 思考 题 在 它们 出 现 的 章节 中 有 了 明确 的 回答 。 但 是 , 我 们 偶尔 会 包含 问题 以 提醒 你 在 其 他 章节 
中 有 相关 的 信息 , 其 至 有 些 内 容 可 能 不 在 本 书 范围 内 。 我 们 认为 这 是 正常 的 ， 更 为 重要 的 是 编写 好 的 软件 
和 思考 这 样 做 的 含义 , 而 不 是 更 适合 于 作为 独立 的 章节 或 书籍 出 现 。 


他》 术语 


这 些 术语 是 编程 和 C++ 方面 的 基本 词汇 。 如 果 你 希望 理解 人 们 谈 到 的 关于 编程 的 主题 和 阐明 目 己 的 思 
路 , 你 应 该 知道 每 个 术语 的 合 义 。 


// 可 执行 程序 main( ) << 函数 目标 代码 
C++ 头 文件 输出 注释 集成 开发 环境 (IDE) 程序 
编译 器 #include 源 代码 编译 时 错误 库 | 语句 
cout 链接 器 
你 也 可 以 以 自己 的 语言 逐步 发 展 出 一 个 词汇 表 。 你 可 以 通过 重复 每 章 后 面 的 练习 5 来 完成 它 。 

<》 习题 


我 们 将 简单 练习 与 习题 分 别 列 出 , 在 尝试 做 习题 之 前 , 请 先 完成 本 章 中 的 简单 练习 。 这 样 做 将 会 节约 
你 的 时 间 。 z 
1. 修改 程序 以 输出 下 面 2 行 


Hello, programming! 
Here we go! 


2. 扩展 你 曾经 学 习 的 知识 , 编写 程序 列 出 使 计算 机 找到 楼 上 浴室 的 指令 (在 2.1 节 中 讨论 )。 你 能 讨论 更 多 
的 人 类 可 以 假设 而 计算 机 不 会 的 步骤 吗 ? 将 它们 加 入 你 的 列表 。 这 是 一 个 “ 像 计算 机 一 样 思考 ”的 好 的 开 
始 。 注 意 , 对 于 大 多 数 人 来 说 ,“ 去 浴室 ”是 一 个 完全 充分 的 指令 。 对 于 那些 对 房子 或 浴室 没有 任何 经 验 
的 人 (想象 一 个 石器 时 代 的 人 被 传送 到 你 的 餐厅 ), 这 个 包含 必要 指令 的 列表 可 能 会 很 长 。 请 不 要 使 用 超 
过 一 页 的 指令 。 为 了 便于 读者 们 阅读 , 你 可 以 增加 一 个 关于 你 所 想象 的 房子 布局 的 简短 描述 。 

3. 编写 一 个 有 关 如 何 从 你 的 宿舍 、 公 寓 "、 房屋 等 的 前 门 到 你 的 教室 (假设 你 在 参观 某 个 学 校 , 如 果 你 无 法 想 
象 , 选择 其 他 目的 地 ) 前 门 的 描述 。 请 一 个 朋友 尝试 按照 这 些 指令 走 , 并 且 对 他 或 她 改进 的 路 线 加 以 解 
释 。 为 了 保持 朋友 关系 , 在 将 这 些 指令 交 给 一 个 朋友 之 前 进行 “实地 测试 ”是 一 个 好 的 主意 。 

4. 找到 一 本 好 的 菜谱 。 阅 读 有 关 烤 制 蓝莓 松 饼 的 指令 ( 如 果 你 在 一 个 “蓝莓 松 饼 " 是 一 种 陌生 的 、 异 国 食品 
的 国家 , 你 可 以 用 自己 更 熟悉 的 食品 来 代替 ) 。 请 注意 , 在 得 到 一 点 帮助 和 指令 的 情况 下 , 这 个 世界 上 的 
大 多 数 人 都 可 以 烤 出 美味 的 蓝莓 松 饼 。 这 里 不 需要 考虑 高 级 的 或 困难 的 精细 食品 。 但 是 ,对 于 作者 来 
说 , 本 书 中 很 少 有 习题 像 这 个 这 样 困难 。 只 是 通过 一 点 儿 练 习 , 你 所 能 做 的 事 令 人 吃惊 。 

。 重新 写 这 些 指令 使 每 个 单独 的 动作 位 于 它们 自己 编号 的 段落 中 。 认 真 列 出 每 个 步骤 使 用 的 所 有 原料 
和 厨房 用 具 。 注 意 关 键 的 细节 ，, 例如 理想 的 烤箱 温度 、 预 热 烤箱 、 准 备 烘 烤 的 薄饼 、 烹 调 技术 的 方 
式 , 以 及 将 松 饼 从 烤箱 中 取出 时 的 注意 事项 。 

。 从 一 个 毫 调 初学 者 ( 如果 你 不 是 ， 请 你 认识 的 不 会 豪 调 的 朋友 帮忙) 的 角度 来 考虑 这 些 指令 。 填写 菜 
谱 作者 (几乎 可 以 肯定 是 一 个 有 误 调 经 验 的 人 ) 漏 掉 的 很 明显 的 步骤 。 

。 建立 一 个 包含 使 用 过 的 术语 的 词汇 表 。( 松 饼 平底 锅 是 什么 ? 如 何 预 热 ? 你 认为 “ 号 人- 意味 着 
什么 ?) 

。 现在 , 烤 制 一 些 松 饼 和 享用 你 的 成 果 。 

5. 为 “术语 ”中 的 每 个 术语 书写 一 个 定义 。 首 先 尽力 看 你 是 否 不 看 本 章 就 可 以 做 到 , 然后 浏览 本 章 以 找到 这 
些 定义 。 你 会 发 现在 你 初次 尝试 定义 和 看 完 本 书 之 后 的 定义 之 间 有 趣 的 区 别 。 你 可 以 参考 一 些 合适 的 在 
线 词 汇 表 , 例如 www. research. att com/ ~ bs/ glossary. html。 通 过 在 查找 之 前 书写 自己 的 定义 , 你 会 加 强 自 
己 从 学 习 中 获得 的 知识 。 如 果 你 需要 重新 读 某 个 部 分 以 形成 一 个 定义 , 这 也 可 以 帮助 你 来 理解 它 。 你 可 
以 自由 使 用 自己 的 词汇 来 进行 定义 , 并 且 按 照 你 认为 合理 的 细节 来 完成 定义 。 在 通常 情况 下 ， 主 要 定义 
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后 面 跟着 一 个 例子 将 是 有 帮助 的 。 你 可 以 将 这 些 定义 存储 在 一 个 文件 中 , 这 样 你 可 以 通过 增加 它们 形成 
后 面 章 节 的 “术语 ”部 分 。 


<》 附 言 

“Hello，World1” 程 序 有 和 多么 重要 ? 它 的 目的 是 使 我 们 熟悉 基本 的 编程 工具 。 当 接触 一 个 新 的 工具 时 ,我 
们 通常 做 一 个 非常 简单 的 例子 , 例如 “Hello，World!1”。 在 这 种 方式 下 , 我 们 将 自己 所 学 的 东西 分 为 两 个 部 
分 : 首先 , 我 们 通过 简单 程序 学 习 有 关 工 具 的 基础 知识 , 然后 , 我 们 在 没有 被 工具 影响 的 情况 下 学 习 更 复杂 
的 程序 。 同 时 学 习 工具 和 语言 的 难度 比 先 学 一 种 后 学 另 一 种 要 大 得 多 。 这 种 将 复杂 任务 分 解 成 一 系列 小 的 
(更 容易 管理 的 ) 步骤 的 学 习 方 式 , 并 不 仅仅 局 限于 编程 和 计算 机 方面 。 它 在 生活 中 的 大 多 数 领域 是 普遍 的 
和 有 用 的 , 特别 是 在 那些 需要 实用 技能 的 领域 。 


第 3 章 对象 、 类 型 和 值 


“这 运 只 青 点 有 准备 的 人 。” 





Louis Pasteur 


本 章 介绍 程序 中 的 数据 存储 和 使 用 的 基础 知识 。 这 样 ,我们 首先 关注 从 键盘 读 取 数据 。 在 建 
立 起 对 象 、 类型、 数值 和 变量 的 基本 概念 之 后 , 我 们 介绍 几 种 操作 符 , 并 且 给 出 有 关 char、int、 
double 和 string 类 型 的 变量 使 用 的 例子 。 


3.1 输入 


“Hello,，World!1” 只 是 打印 到 屏幕 。 它 产生 输出 , 不 读 取 任何 内 容 , 也 就 是 不 从 用 户 那 里 得 到 
输入 。 这 令 人 相当 厌烦 。 实 际 的 程序 通常 基于 我 们 给 它 的 输入 产生 结果 , 而 不 是 当 我 们 每 次 执行 
它们 时 都 做 相同 的 事 。 

为 了 读 取 数据 , 我 们 需要 将 其 读 入 某 个 地 方 ， 即 我 们 需要 在 计算 机 内 存 中 的 某 个 地 方 放置 读 
取 的 内 容 。 我 们 将 这 样 一 个 "地方 " 称 为 一 个 对 象 。 一 个 对 象 是 一 个 某 种 类 型 的 内 存 区 域 , 类 型 指 
定 了 可 以 放置 什么 样 的 信息 。 一 个 有 名 字 的 对 象 称 为 一 个 变量 。 例 如 , 字符 本 
存放 在 string 变量 中 , 整数 存放 在 int 变量 中 。 你 可 以 将 对 象 看 成 一 个 “ 盒 age:| 有 : 
子 ”, 你 可 以 在 其 中 放置 该 对 象 类 型 的 数值 ， 如 右 图 所 示 。 

上 图 表示 一 个 名 为 age 的 int 类 型 的 对 象 ， 其 中 保存 的 是 整数 值 42。 通 过 使 用 一 个 字符 变量 ， 
我 们 可 以 从 输入 中 读 取 一 个 字符 , 然后 将 它 打印 出 来 , 具体 如 下 : 


// read and write a first name 
#include "std lib_facilities.h” 





int main() 


{ 
cout << "Please enter your first name (followed by 'enter ):n ; 
string first_ name;  //first_name is a variable of type string 
cin >> first_ name; /read characters into first_name 
cout << "Hello, " << first_name << "i\n"; 
} 


#include 与 main( ) 与 第 2 章 中 的 内 容 相 似 。 由 于 我 们 的 所 有 程序 ( 直到 第 12 章 ) 都 需要 #in- 
clude, 我 们 将 不 再 介绍 它 以 避免 引起 你 分 心 。 同 样 , 我 们 有 时 需要 将 代码 放 入 main( ) 或 其 他 函数 
中 才能 工作 , 就 像 下 面 这 样 : 

cout << "Please enter your first name (followed by 'enter'):\n"; 

我 们 假设 你 可 以 理解 如 何 将 这 个 代码 加 入 一 个 完整 的 程序 以 便 测试 。 

main( ) 中 的 第 一 行 简 单 地 输出 一 个 信息 ， 以便 鼓 励 用 户 输入 一 个 名 字 。 这 个 信息 通常 称 为 提 
示 符 , 这 是 由 于 它 提示 用 户 完 成 某 个 操作 。 下 一 行 定义 了 一 个 名 为 first_name 的 string 变量 ， 接 下 
来 的 程序 读 取 键盘 输入 存 和 变量 ,然后 输出 一 个 欢迎 词 。 接 下 来 , 我 们 逐 行 分 析 三 行 : 

string first_name; // first_name is a variable of type string 
本 行 会 划分 一 个 可 以 保存 一 个 字符 趾 的 内 存 区 域 , 并 将 它 命名 为 first_name， 
如 右 图 所 示 。 





first_name:| 
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定义 是 用 于 将 一 个 新 的 名 字 加 入 一 个 程序 , 并 为 一 个 变量 分 配 内 存 空间 的 语句 。 

下 一 行将 (键盘 ) 输 入 的 字符 串 读 取 到 变量 : 

Cin >> first_name; // read characters into first_name 
名 字 cin 是 由 标准 库 定义 的 标准 输入 流 ( 读 为 “see-in”,“character input” 的 缩写 ) 。 操 作 符 >> 的 第 
二 个 操作 指定 对 象 输入 到 哪里 。 因 此 ,如果 我 们 输入 名 字 ( 例 如 Nicho- 
las) , 后 接 一 个 换行 ,字符 串 " Nicholas" 将 会 变 成 first_name 的 值 ， 如 右 图 first_name: | “Niaholas ， 
所 示 。 新 行 是 必要 的 以 引起 计算 机 的 注意 。 

计算 机 简单 地 收集 输入 的 字符 , 直到 输入 一 个 新 行 ( 按 下 回 车 键 )。 这 段 “延迟 ”给 你 改变 主 
意 的 机 会 , 在 按 回 车 键 之 前 可 以 删除 或 修改 某 些 字符 。 这 个 新 行 不 会 成 为 保存 在 内 存 中 的 字符 串 
的 一 部 分 。 

在 将 输入 的 字符 串 放 人 first_name 之 后 , 我 们 就 可 以 使 用 它 了 : 

cout << "Hello, " << first_name << "!\n"; 


本 行 会 在 屏幕 上 打印 Hello, 接着 是 Nicholas (first _name 的 值 ), 接着 是 ! 和 一 个 新 行 ('\n'): 


Hello, Nicholas! 


如 果 我 们 喜欢 重复 和 额外 的 输入 , 我 们 可 以 用 三 个 单独 的 输出 语句 来 代替 : 


cout << "Hello, "; 
cout << first_name; 
Cout << "i\n"; 


但 是 , 我 们 不 是 打字 员 ,更 重要 的 是 非常 不 乾 欢 不 必要 的 重复 (由 于 重复 为 出 错 提供 了 机 会 )， 因 
此 我 们 将 三 个 输出 语句 合并 为 一 个 语句 。 

注意 , 我 们 在 " Hello," 处 使 用 的 是 引 叶 ,而 在 first_name 处 没有 这 样 做 。 我 们 希望 输出 字符 串 
常量 时 使 用 引号 。 当 我 们 不 使 用 引号 时 , 我 们 希望 输出 的 是 名 字 中 的 值 。 考 虑 一 下 : 


cout << "first_ name't << "is "<< first_name; 
在 这 里 ，"first_name" 输出 的 是 十 个 字符 first _name， 而 first_name 输出 的 是 变量 first_name 中 的 值 ， 
在 这 种 情况 下 是 Nicholas。 因 此 ,我们 得 到 : 


first_name is Nicholas 
3.2 变量 


如 果 没 有 存储 在 内 存 中 的 数据 , 我 们 基本 上 不 能 用 计算 机 做 任何 有 趣 的 事 , 正如 上 面 的 例子 
中 所 说 的 字符 串 输 入 。 我 们 用 来 存储 数据 的 “位 置 ” 称 为 对 象 。 我们 需要 使 用 一 个 名 字 来 访问 一 
个 对 象 。 一 个 命名 后 的 对 象 称 为 变量 , 它 有 特定 的 类 型 (例如 int 或 string) ,类 型 决定 我 们 将 什么 
赋 给 对 象 (例如 , 123 可 以 赋 给 int 型 和 "Hello, World! \n" 可 以 赋 给 string 型 ), 以 及 可 以 使 用 的 操 


作 (例如 , 我们 可 以 对 多 个 int 型 使 用 * 操作 符 进行 乘法 运算 ,对 多 个 string 型 使 用 <= 操作 符 进 行 
比较 ) 。 我 们 赋 给 变量 的 数据 项 称 为 值 。 一 个 用 来 定义 变量 的 语句 (通常 ) 称 为 定义 ， 一 个 定义 可 
以 (通常 会 ) 提供 一 个 初始 值 。 考 虑 一 下 : 


string name = "Annemarie"; 
int number_of_steps = 39; 


我 们 可 以 像 这 样 来 可 视 化 这 些 变 量 : 








我 们 不 能 将 类 型 错误 的 值 赋 给 一 个 变量 : 
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string name2 = 39; / error: 39 isn' a string 
int number_of steps = "Annemarie")  //error: “Annemarie” is not an int 


编译 器 将 会 记录 每 个 变量 的 类 型 ,并 确认 你 对 它 的 使 用 是 否 与 它 的 类 型 一 致 , 就 像 你 在 它 的 定义 
中 所 指定 的 那样 。 ; 

C++ 提供 了 相当 多 的 类 型 (参见 人 8 市 )。 但 是 , 你 只 使 用 其 中 五 种 类 型 ， 就 完全 可 以 写 出 
下 面 的 好 的 程序 : 


int number_of_steps = 39; / int for integers 

double flying_time = 3.5; // double for floating-point numbers 
char decimal_point =".'; // char for individual characters 
string name = "Annemarie";  //string for character strings 

bool tap_on = true; // bool for logical variables 


名 字 double 的 原因 是 历史 的 : double 是 “ 双 精 度 浮 点 ”的 简称 。 浮 点 是 数学 上 实数 概念 在 计算 机 中 
的 近似 。 

注意 , 每 种 类 型 的 文字 常量 都 有 自己 的 特殊 风格 : 

39 // int: an integer 

3.5 // double: a floating-point number 
/ char an individual character enclosed in single quotes 


Annemarie”  //string: a sequence of characters delimited by double quotes 
true // bool: either true ar false 


一 串 数字 (例如 1234、2 或 976) 表 示 一 个 整数 ， 在 单 引号 中 的 一 个 字符 (例如 1 、@ x') 表 示 一 个 字 
符 , 带 小 数 后 的 一 串 数字 (例如 1.234、0.12 或 .98) 表 示 一 个 浮 点 值 , 在 双 引号 中 的 一 串 字 符 ( 例 如 ” 
1234" 、" Howdy1" 或" Annemarie" ) 表 示 一 个 字符 串 。 如 果 要 获得 文字 常量 的 细节 描述 , 参见 A. 2 节 。 


3.3 输入 和 类 型 
给 和 操作 >> (“get fom”) 是 对 类 型 敏感 的 ， 它 污 取 的 值 与 变量 类 型 需要 一 致 例如 ， 


// read name and age 


int main() 
{ 
cout << "Please enter your first name and age\n"; 
string first_name;  // string variable 
int age; // integer variable 
cin >> first_name; /read a string 
cin >> age; /read an integer 
cout << "Hello, " << first_name << 2 Be << age <<")n"; 
} 
因此 , 如 果 你 输入 Carlos 22 ，>> 操作 符 将 Carlos 读 人 first_name, 将 22 读 人 age, 并 且 生 成 这 个 输出 : 
Helio, Carlos (age 22) 


为 什么 它 不 将 Carlos 22( 全 部 ) 读 人 first_name? 这 是 由 于 按照 规定 , 字符 串 的 读 取 会 被 空白 
符 所 终止 , 包括 空格 、 换 行 和 tab 字符 。 否 则 , 空白 符 在 默认 情况 下 会 被 >> 忽略 。 例 如 , 你 可 以 
在 读 取 的 数字 之 前 添加 任意 多 的 空格 ，>> 将 会 跳 过 它们 并 读 取 这 个 数字 。 

如 果 你 输入 22 Carlos, 你 将 看 到 奇怪 的 东西 ， 直到 你 能 够 理解 这 一 切 。22 将 会 读 入 first_ 
name， 这 是 由 于 22 毕竟 是 一 串 字符 。 另 一 方面 ，Carlos 并 不 是 一 个 整数 , 因此 它 不 会 被 读 取 。 这 
时 的 输出 将 是 22 和 一 些 随机 数 , 例如 - 96739 或 0。 为 什么 ? 因为 你 没有 给 age 赋 一 个 初始 值 ， 
并 且 没 能 成 功 地 读 取 一 个 值 存 人 它 。 因 此 ， 当 你 开始 执行 时 ， 就 会 得 到 内 存 中 的 某 个 部 分 的 “ 垃 
圾 值 ” 。 在 10.6 节 中 , 我 们 讨论 “输入 格式 错误 ”的 处 理 方式 。 现 在 , 我 们 只 是 初始 化 age, 这 样 在 
输入 错误 时 , 我 们 会 获得 一 个 可 预测 的 值 : 
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1 read name and age (2nd version) 

int main() 

{ 
cout << "Please enter your first_name and age\n"; 
string first_name = "???"; //string variable 

HN (“799" means “don't know the name’”) 

intage=-1;  //integer variable (-1 means “don't know the age") 
cin >> first_name >> age; I/ read a string followed by an integer 
cout << "Hello, " << first_name << " (age " << age << ")\n"; 


} 
现在 , 输入 22 Carlos 将 会 输出 : 

Hello, 22 (age -1) 
注意 , 我 们 可 以 在 一 个 输入 语句 中 读 取 几 个 值 , 就 像 我 们 可 以 在 一 个 输出 语句 中 写 人 人 几 个 值 一 
样 。 注 意 ，<< 和 >> 都 是 对 类 型 敏感 的 , 因此 我 们 可 以 输出 int 型 变量 age 和 字符 文字 '\n', 以 及 
string 型 变量 first_name 和 字符 串 文 字 " Hello," 、" (age" 和 " ) \n" 。 

使 用 >> 读 取 的 String( 默认 情况 下 ) 会 被 空格 所 终止 , 也 就 是 说 , 它 只 能 读 取 一 个 字 。 但 是 ， 
我 们 有 时 需要 读 取 多 个 字 。 当 然 会 有 多 种 方法 来 解决 这 个 问题 。 例 如 , 我 们 可 以 像 这 样 来 读 取 一 


个 包括 两 个 字 的 名 字 ; 

int main() 

{ 
cout << "Please enter your first and second names\n"; 
string first; 
string second; 
cin >> first >> second; I/ read two strings 
cout << "Hello, " << first << ' ' << second << \n'; 

} 


我 们 简单 地 使 用 >> 两 次 , 每 次 针对 一 个 名 字 。 当 我 们 想 输出 多 个 名 字 时 , 我 们 必须 在 它们 之 间 
插 人 一 个 空白 符 。 | 
试 一 试 ”运行 这 个 “名 字 和 年 龄 "的 例子 。 然 后 ,修改 它 以 月 份 的 形式 输出 年 龄 : 读 
取 输 入 的 年 龄 并 (使 用 * 揉 作 特 ) 乘 以 12。 将 年 龄 读 入 一 个 double 型 的 变量 , 使 5.5 岁 
的 孩子 骄 做 于 他 比 5 岁 的 孩子 大 。 


3.4 运算 和 运算 符 


除了 指定 什么 值 可 以 存储 在 一 个 变量 中 之 外 , 变量 类 型 还 决定 了 我 可 以 对 它 进 行 什么 操作 和 
它们 表示 什么 。 例 如 


int count; 

cin >> count; // >> reads an integer into count 
string name; 

cin >> name; />> reads a string into name 
int c2 = count+2; I + adds integers 

string s2= name + " Jr. "; I + appends characters 

int c3 = count—2; 1/ — subtracts integers 

string s3 = name — "Jr. "; // error: - isn't defined for strings 


通过 “错误 ”, 我 们 认识 到 编译 器 拒绝 程序 对 字符 串 进行 碱 。 编 译 器 确切 地 知道 哪 种 操作 可 以 应 用 
于 哪 种 变量 , 这 样 可 以 防止 很 多 错误 的 发 生 。 但 是 ， 编 译 器 不 知道 哪 种 操作 对 你 有 用 ,因此 它 很 


高 兴 接 受 合法 的 操作 ,即使 它们 在 你 看 来 可 能 是 荒 雇 的。 例如 
int age = —100; 
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很 明显 , 你 的 年 龄 不 能 是 一 个 负数 , 但 是 没有 人 会 告诉 编译 器 , 因此 它 会 为 这 个 定义 生成 代码 。 
下 表 给 出 了 一 些 常 见 的 和 有 用 的 类 型 可 以 使 用 的 操作 符 : 


赋值 
加 
连接 
减 
冬 
除 
余数 ( 模 ) 
递 加 1 
递减 1 
加 mn 
添加 到 结尾 
减 n 


小 于 
小 于 或 等 于 


bool char int double string 
+ + 
+ 
水 
/ / 
% 
十 十 十 十 
+ 三 n + 三 1n 
+ 二 
-=n -=n 
术 二 水 二 
= /= 
op = 
8>>X 8 >>xX 32>>X 8 >>X S>>xX 
8S <<X 8 <<X 外 <<X 8 <<X 8 <<X 
1 = 1 = 1 = 三 f = 
> > > > 
> 二 > 二 > 二 > 三 > 三 
< < < < < 


人 
| 
人 
| 
人 

中 
人 
有 
人 
1l 


空白 表示 一 个 操作 符 不 能 直接 用 于 一 种 类 型 (尽管 可 能 有 间接 使 用 这 种 操作 符 的 方式 ，, 见 3.7 
节 )。 我 们 将 在 后 面 的 内 容 中 解释 这 些 操作 符 。 这 里 的 关键 是 有 很 多 有 用 的 操作 符 , 它们 对 相似 
的 类 型 通常 是 相同 的 。 

我 们 来 介绍 一 个 涉及 浮 点 数 的 例子 : 


// simpile program to exercise operators 
int main() 


{ 


} 


cout << "Please enter a floating-point value: "; 
doublen; . 
Cin >> nN; 
cout << "n=="<<n 
.<< "nn+1 == 1<< n+1 


<< rwnthree times n ==" <<3°n 

<< "ntwicen == "<< n+n 

<< "nn squared == "<< nen 

<< "nhalf of n == " << n/2 

<< wsquare root of n == " << sqrt(n) 

<< endjl; janother name for newline (“end of line”) 


很 明显 ,常见 的 数学 操作 有 常见 的 表示 法 和 含义 , 这 点 和 我 们 在 小 学 学 到 的 知识 一 样 。 很 自然 ， 
并 不 是 我 们 想 对 一 个 浮 点 数 做 的 任何 事 ( 例 如 得 到 它 的 平方 根 ) 都 有 相应 的 操作 符 。 很 多 操作 都 
表示 为 命名 函数 的 形式 。 在 这 种 情况 下 , 我 们 使 用 标准 库 中 的 sqrt( ) 来 得 到 n 的 平方 根 : sqrt 
(n) 。 这 种 表示 法 与 数学 中 相似 。 我 们 将 会 逐渐 学 习 使 用 函数 , 并 在 4.5 节 和 8.5 节 中 讨论 它们 
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的 细节 。 


试 一 试 运行 这 个 小 程序 。 然 后 , 修改 它 以 读 取 一 个 int 型 而 不 是 一 个 double 型 。 
注意 , sqrt( ) 不 是 针对 int 型 定义 的 ,因此 将 nm 赋值 给 一 个 double 型 并 执行 sqrt( )。 另 外 ， 
“练习 ”一 些 其 他 操作 。 注 意 , 对 于 int 型 来 说 , /是 整除 , % 是 余数 ( 模 ), 因此 5/2 等 于 2 
(而 不 是 2.5 或 3), 5%2 等 于 1。 对 整数 *、/ 和 狗 的 定义 ， 保 证 两 个 正 整数 a 和 hb 可 以 


得 到 ab*a+a%b==a。 


字符 串 拥 有 更 少 的 操作 符 , 但 在 第 23 章 中 将 看 到 尽 够 多 的 命名 操作 。 但 是 , 所 文 持 的 操作 符 


都 可 以 按 常 规 方 式 使 用 。 例 如 : 


// read first and second name 


int main() 
{ 
cout << "Please enter your first and second names\n"; 
string first; 
string second; 
cin >> first >> second; // read two strings 


string name = first + ''+ second; /concatenate strings 
cout << "Hello, ’ << name << \n'; 


} 


字符 串 + 意味 着 连接 , 也 就 是 说 , 当 sl 和 s2 是 字符 串 时 ,sl + s2 也 是 字符 串 , 包含 来 自 sl 的 字 


符 后 接 来 自 s2 的 多 个 字符 。 例 如 ， 如果 sl 的 值 为 "Hello" , s2 的 值 为 "World"， 


为 "HelloWorld" 。 字 符 串 比较 操作 特别 有 用 : 


// read and compare names 
int main() 
{ 
cout << 1Piease enter two names\in",; 
string first; 
string second; 
cin >> first >> second; // read two strings 
if (first == second) cout << "that's the same name twice\n"; 
这 (first < second) 
cout << first << "is alphabeticailly before " << second <<'\n'; 
if (first > second) 
cout << first << " is alphabeticaily after " << second <<™\n'; 


} 


在 这 里 , 我 们 使 用 站 语句 来 根据 条 件 选择 动作 ， 该 语句 将 在 4. 4.4.1 节 中 详细 介绍 。 


3.5 赋值 和 初始 化 


那么 


sl + s2 的 值 


在 很 多 方面 , 最 有 趣 的 操作 符 是 赋值 , 表示 为 = 。 它 为 一 个 变量 赋予 一 个 新 的 值 。 例 如 : 


int a = 3; /a starts out with the vaiue 3 


a=4; 





int b = a; I/ b starts out with a copy of a’s value {that is, 4) 
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b = a+5; Ib gets the value a+5 (that is, 9) 





a=at+7; /a gets the value a+7 (that is, 11) 






最 后 一 次 赋值 需要 注意 。 首 先 , 很 明显 = 并 不 意味 着 等 于 ， a 不 等 于 a+7。 它 意味 着 赋值 , 也 就 
是 将 一 个 新 的 值 赋予 一 个 变量 。a =a +7 所 做 的 事 如 下 : 

1) 首先 , 得 到 a 的 值 , 这 里 是 整数 4。 

2) 其 次 , 将 7 和 4 相 加 , 得 到 整数 11。 

3) 最 后 , 将 整数 11 赋予 a。 

我 们 也 可 以 通过 字符 串 来 说 明 赋 值 : 


stringa="alpha";  //a starts out with the value “alpha” 
a= "beta"; 


string b = a; 
b = a+"gamma ， 


a=at+"delta"; 


b: betagamma 
以 上 , 我 们 使 用 “以 … 开 始 ”" 和 “获得 "来 区 别 两 种 相似 的 操作 , 但 两 者 在 逻辑 上 是 有 区 别 的 : 
。 初始 化 (给 一 个 变量 它 的 初 值 ) 。 | 
。 赋值 (给 一 个 变量 一 个 新 的 值 ) 。 
这 些 操作 是 如 此 相似 , 因此 C++ 允许 我 们 对 它们 使 用 相同 的 符号 ( = ) : 


inty= 8; /initialize y with 8 
x=9; //assign 9 to x 


string t= "howdy!"; // initialize t with “howdy!” 

s="G'day™; //assign “G'day” tos 
但 是 ,赋值 和 初始 化 在 逻辑 上 是 不 同 的 。 你 可 以 通过 类 型 描述 (如 int 或 string) 来 区 分 它们 , 初始 
化 总 是 从 类 型 描述 开始 , 而 赋值 并 不 需要 这 样 做 。 从 原则 上 来 说 , 初始 化 时 变量 总 是 空 的 。 男 一 
方面 , 赋值 在 放 入 一 个 新 的 值 之 前 , 首先 必须 将 旧 的 值 清 空 。 你 可 以 将 变量 看 做 是 一 种 小 的 盒 
子 , 值 是 一 个 可 以 放 入 其 中 的 具体 东西 (例如 一 枚 硬币 )。 在 初始 化 之 前 盒子 是 空 的 , 但 是 在 初始 
化 之 后 它 总 是 包含 一 枚 硬币 , 因此 为 了 在 里 面 放 入 一 枚 新 的 硬币 , 你 ( 即 赋值 操作 符 ) 首先 需要 移 


务 3 了 3 莫 对 儿 、 类 型 和 入。 4 


走 旧 的 东西 (“销毁 旧 的 值 ”), 而 且 你 不 能 留 下 一 个 空 盒子 (必须 赋予 一 个 值 )。 在 计算 机 内 存 中 
并 不 完全 如 此 , 但 是 它 对 于 我 们 理解 后 面 的 内 容 没 有 坏处 。 
3.5.1 实例 : 删除 重复 单词 

当 我 们 想 将 一 个 新 的 值 放 和 人 一 个 对 象 ， 就 需要 赋值 操作 。 当 你 考虑 赋值 操作 时 , 很 明显 它 在 
多 次 重复 做 一 些 事 情 时 赋值 是 最 有 用 的 。 当 我 们 想 以 一 个 不 同 的 值 重 复 做 某 事 时 ,我们 需要 进行 
一 次 赋值 。 让 我 们 来 看 一 个 小 的 程序 , 它 在 一 连 串 单词 中 找到 相 邻 的 重复 字符 。 这 段 代码 是 大 多 
数 的 语法 检查 程序 的 一 部 分 : 


int main() 

{ 
string previous = " ") jprevious word; initialized to “hot a word” 
string current; /current word 
while (cin>>current) { lf read a Stream of words 


if (previous == currenb //check if the word is the same as jast 
cout << “repeated word: " << current << \n'; 
previous = current; 
} 
} 


由 于 它 没 有 告诉 我 们 重复 单词 在 文本 中 的 哪个 位 置 出 现 ， 因此 这 个 程序 对 我 们 并 不 是 很 有 帮助 ， 
但 是 现在 它 够 用 了 。 我 们 从 如 下 一 行 开始 逐 行 分 析 这 个 程序 : 


string current; ~ /current word 


这 是 一 个 字符 串 变 量 , 我 们 使 用 它 来 读 取 当 前 ( 即 最 近 阅读 ) 人 


while (cin>>current) 
这 个 结构 称 为 一 个 while 语句 , 它 对 右 侧 的 程序 结构 感 兴趣 , 我 们 将 在 4.4.2.1 节 中 详细 介绍 。 
while 的 意思 是 当 输 入 操作 cin >> current 成 功 的 情况 下 ,， (Cin >> current) 后 面 的 语句 将 反复 执行 ， 
而 cin >> current 成 功 的 条 件 是 从 标准 输入 中 读 取 字符 。 记 住 , 对 于 一 个 string，>> 读 取 的 是 用 空 
格 分 开 的 单词 。 你 可 以 通过 给 程序 一 个 终止 输入 符号 (通常 是 指 文件 结尾 ) 来 终止 这 个 循环 。 在 
Windows 系统 的 计算 机 中 , 使 用 Cta +Z( 同 时 按 Control 和 2) I 在 UNIX 或 Linux 
系统 的 计算 机 中 , 使 用 Ctrl + D( 同 时 按 Control 和 D)。 

因此 , 我 们 所 做 的 是 读 取 一 个 单词 到 current, 然后 将 它 与 前 一 个 单词 (存储 在 previous 中 ) 比 
较 。 如 果 它 们 是 相同 的 , 我 们 将 会 : 


if (previous == current)  // check if the word is the same as last 
cout << "repeated word: " << current << \n'; 


然后 , 我 们 准备 好 对 下 一 个 单词 重复 进行 上 述 操作 。 我 们 通过 将 current 单词 拷贝 到 previous 中 来 
进行 这 个 操作 : 

previous = = current; 
这 可 以 处 理 我 们 开始 后 的 所 有 情况 。 当 第 一 个 单词 没有 前 一 个 单词 可 以 比较 时 ， 这 段 代码 将 会 如 
何 处 理 呢 ? 这 个 问题 可 以 在 定义 previous 时 得 到 解决 : 

string previous="";  //previous word; initialized to “not a word z 
"" 只 包含 一 个 字符 (空格 字符 , 通过 按键 盘 中 的 空格 键 来 得 到 ) 。 输 入 操作 符 >> 会 跳 过 空格 , 我 
们 不 可 能 通过 输入 得 到 它 。 因 此 , 第 一 次 执行 while 语句 时 , 检测 


if (previous == current) 
失败 (正如 我 们 所 希望 的 ) 。 | 

理解 程序 流程 的 一 种 方式 是 “推演 计算 机 的 运行 ”, 也 就 是 按 程 序 的 顺序 逐 行 执行 指定 的 工 
作 。 在 一 张 纸 上 画 出 很 多 方块 , 然后 在 里 面 写 人 程序 运行 的 结果 。 按 程序 指定 的 方式 修改 储存 在 


42 ”和 旬 一 郭 分 堆 太 知 厌 


其 中 的 值 。 : 0 
试 一 试 ”你 亲自 用 一 张 纸 来 执行 这 个 程序 。 和 给 入 是 “The cat cat jumped”。 即 使 是 有 
经 验 的 程序 员 ， 当 某 段 代码 不 那么 清晰 时 ， 也 会 用 这 种 技术 来 推演 其 结果 。 
试 一 试 ”运行 “重复 单词 检测 程序 ” 。 用 句子 “She she laughed He He He because what 
he did did not look very very good go0od” 来 测试 它 。 这 里 有 多 少 个 重复 的 单词 ?为 什么 ? 在 
这 里 ,单词 的 定义 是 什么 ? 重复 单词 的 定义 又 是 什么 ? (例如 ,，“She she” 是 否 重复 ?) 


3.6 组 合 赋值 运算 符 
一 个 变量 的 递增 (增加 1) 在 程序 中 很 常用 ，C++ 为 它 提供 了 一 个 特定 的 语法 。 例 如 : 


十 十 CDUnmter 


意味 着 


counter = counter + 1 
这 里 有 很 多 其 他 常用 方式 , 可 以 基于 变量 的 当前 值 来 修改 它 。 例 如 , 我 们 可 能 想 将 它 加 7、 减 9 或 
乘 2。C++ 直接 支持 这 些 操 作 。 例 如 : 


a+=7; /meansa=a+7 
b ~=9;  //meansb=b-9 
C ?= 2; j means c = c*2 


通常 , 对 一 些 二 进 制 操作 符 oper, a oper = b 意味 着 a = a oper b( 参 见 附录 A.5)。 首 先 , 这 一 规则 
提供 了 操作 符 += 、-= 、*=、/=. 和 % = 。 这 提供 了 一 种 令 人 愉快 的 、 紧 次 的 、 直 接 反映 我 们 观点 
的 表示 方法 。 例 如 , 在 很 多 应 用 领域 中 , /= 和 %= 被 称 为 “缩放 ”。 
3. 6.1 实例 : 重复 单词 统计 

考虑 上 面 的 检测 重复 的 相 邻 单词 的 例子 。 我 们 可 以 通过 得 到 重复 的 单词 在 序列 中 的 位 置 来 
改进 程序 。 我 们 可 以 设置 一 个 简单 的 变量 , 简单 地 统计 单词 数 并 输出 重复 的 单词 数 : 


int main() 
{ 
int number of words = 0; 
string previous =""; /notaword 


string current; 
while (cin>>current) { 

++number_ of words; //increase word count 

if (previous == current) 

cout << "word number ’ << number_of_words 
<<" repeated: "<< current <<™\n'; “ 
”previous = current; 
} 
} 
我 们 将 单词 计数 器 设置 为 0。 我 们 每 次 看 到 一 个 单词 , 就 会 将 这 个 计数 器 递增 ; 


++number_of_words; - 
这 样 , 第 一 个 单词 变 为 数值 1, 下 一 个 单词 变 为 数值 2, 依次 类 推 。 我 们 也 可 以 按 以 下 方式 完成 相 
同 功能 z 
number_of_words += 1; 
或 者 是 
number_of_words = number_of_words+1; 
但 是 ，++ number_of_words 更 加 简短 , 并 且 直 接 表达 递增 的 思想 。 - 
注意 , 这 个 程序 与 3. 5. 1 节 中 的 程序 是 如 此 相似 。 很 明显 , 我 们 只 是 将 这 个 程序 从 3. 5.1 节 
拿 来 , 并 对 它 进行 一 点 儿 修 改 以 实现 我 们 的 目标 。 这 是 我 们 解决 一 个 问题 时 用 到 的 一 个 非常 通用 
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的 技术 : 当 遇 到 一 个 问题 需要 解决 时 , 我 们 找到 一 个 相似 的 问题 并 用 我 们 的 方案 加 以 适当 修改 。 
不 要 从 头 开始 ,除非 你 不 得 不 这 样 做 。 在 一 个 程序 早期 版 本 的 基础 上 修改 育 管 会 节省 大 量 时 间 . 
我 们 将 会 从 成 功 深入 原始 程序 中 受益 良 多 。 


3.7 命名 


我 们 命名 自己 的 变量 , 这 样 我 们 可 以 记 住 它们 , 并 在 程序 的 其 他 部 分 使 用 。 在 C++ 中 什么 可 
以 作为 一 个 名 字 呢 ?在 一 个 C++ 程序 中 , 一 个 名 字 必 须 以 一 个 字母 开始 , 并 且 只 能 包含 字母 、 数 
字 和 下 划 线 。 例 如 : 
i 
Fourier_transform 
Polygon 
以 下 这 些 不 是 名 字 : 
2x I/ a name must start with a letter 


time$to$market  //$ isnota letter, digit or underscore 
Start menu I/ space is not a letter, digit, or underscore 


当 我 们 说 “不 是 名 字 " 时, 我们 的 意思 是 C++ 编译 器 不 认为 它们 是 名 字 。 

如 果 你 阅读 系统 代码 或 机 器 生成 的 代码 ,你 可 能 看 到 以 下 划 线 开始 的 名 字 , 例如 _foo。 你 自 
己 不 要 这 样 写 , 这 样 的 名 字 是 为 编译 器 和 系统 实体 保留 的 。 尽 量 避 免 使 用 下 划 线 ,这样 你 的 名 字 
将 不 会 与 编译 丹 生 成 的 名 字 冲 突 。 

名 字 是 区 分 大 小 写 的 , 也 就 是 说 , 大 写字 母 和 小 写字 母 是 不 同 的 , 因此 x 和 XX 是 不 同 的 名 字 。 
下 面 这 个 小 程序 至 少 有 4 个 错误 : 

#include "std_lib_facilities.h" 

int Main() 

{ 

String s = "Goodbye, cruel world! "; 


cOut <<S<< Nn'; 
} 


在 定义 名 字 时 只 用 一 个 字符 来 区 分 通常 不 是 一 个 好 主意 , 例如 one 和 One, 它 不 会 使 编译 器 混淆 ， 
但 是 它 容易 使 程序 员 混 消 。 
试 一 试 ”编译 “Goodbye, cruel world! "程序 , 并 检查 错误 信息 。 编 译 器 是 否 能 发 现 所 

有 错误 ? 它 遇 到 问题 时 的 建议 是 什么 ? 编译 器 是 否 混淆 并 发 现 超过 4 个 错误 ? 依次 改正 

这 些 错误 ， 首 先 从 词法 开始 ， 看 错误 信息 如 何 改变 (与 改进 ) 。 
C++ 语言 保留 了 很 多 (大 约 70 个 ) 名 字 作 为 “关键 字 ”"。 我 们 将 在 附录 A. 3. 1 中 列 出 它们 。 你 不 
能 使 用 它们 作为 你 的 变量 、 类 型 、 函 数 等 的 名 字 。 例 如 ， 

int if = 7; Werror “if is a keyword 
你 可 以 使 用 标准 库 中 的 名 字 ( 例 如 string)，, 但 是 你 不 应 该 这 样 做 。 如 果 你 想 要 使 用 标准 库 的 话 ， 
这 样 一 个 通用 名 字 的 重用 将 会 带 来 麻烦 : 

int string =7; /this will lead to trouble 
当 你 为 自己 的 变量 、 函数 、 类 型 等 选择 名 字 时 , 最 好 选择 有 特定 含义 的 名 字 。 也 就 是 说 , 选择 有 
助 于 人 们 理解 你 的 程序 的 名 字 。 如 果 你 将 变量 胡乱 命名 为 “简单 型 "的 名 字 , 例如 世 L、 交 、s3 与 
p7, 则 你 在 理解 程序 要 做 什么 时 也 会 遇 到 问题 。 缩 写 和 仅 有 首 字母 的 缩写 会 使 人 糊涂 ,因此 要 说 
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慎 使 用 。 tt 但 是 对 于 下 面 的 名 字 , 我 们 预料 至 少 有 一 个 使 你 
感到 困惑 : 

mtbf 

TIA 

myw 

NBY 


我 们 预料 在 几 个 月 之 内 , 我 们 自己 也 至 少 会 忘掉 其 中 一 个 名 字 的 含义 。 

短 名 字 ( 例 如 x 与 让 在 常规 使 用 时 是 有 意义 的 。 也 就 是 说 , x 可 能 是 一 个 本 地 变量 或 一 个 参 
数 (参见 4.5 节 与 8.4 节 ), i 可 能 是 一 个 循环 的 索引 ( 见 4.4.2.3 节 )。 四 

不 要 使 用 很 长 的 名 字 , 它们 难以 输入 , 由 于 太 长 难以 在 一 个 屏幕 中 显示 ,也 难以 快速 读 取 。 
下 面 这 些 名 字 可 能 是 合适 的 : 

partial_sum. 


element_count 
stable_partition 


下 面 这 些 名 字 可 能 太 长 : 


the_number_of_elements 
remaining_free_slots_in_symbol_tabile 


我 们 的 “风格 ”是 在 一 个 标识 符 中 使 用 下 划 线 来 区 分 单词 , 例如 element_count, 而 不 是 其 他 方案 
(例如 elementCount 与 ElementCount) 。 我 们 不 使 用 全 部 大 写字 母 的 名 字 , 例如 ALL_CAPITAL_LE- 
TTERS, 这 是 由 于 它们 通常 保留 作为 宏 ( 参 见 27.8 节 与 附录 A. 17.2), 因此 我 们 避免 这 样 使 用 。 
我 们 使 用 首 字母 大 写 来 定义 自己 的 类 型 , 例如 Square 与 Graph。C++ 语 言 和 标准 库 不 使 用 大 写字 
母 , 因此 它们 使 用 int 而 不 是 Int, 使 用 string 而 不 是 String。 因 此 , 我 们 的 约定 会 帮助 你 减少 对 自 
己 类 型 和 标准 类 型 的 混 消 。 

避免 使 用 容易 错误 、 误 读 或 混淆 的 名 字 。 例 如 : 


Name names names 

foo f00 fl 

fi fl fi 
字符 0、o、0、1、1 和 I 容易 引起 麻烦 。 
3.8 类 型 和 对 象 


类 型 的 概念 是 C++ 和 大 多 数 编程 语言 的 核心 。 让 我 们 以 更 紧密 和 稍微 带 有 技术 性 的 观点 来 
看 待 类 型 , 特别 是 我 们 在 计算 过 程 中 用 来 存储 数据 的 对 象 类 型 。 它 将 会 在 长 时 间 运 行 时 节省 时 
间 ,， 它 也 可 能 避免 引起 你 的 混淆 。 

类 型 定义 一 组 可 能 的 值 与 一 组 操作 (对 于 一 个 对 象 ) 。 
e。 对 象 是 用 来 保存 一 个 指定 类 型 值 的 一 些 内 存单 元 。 
。 值 是 被 解释 为 一 个 类 型 的 内 存 中 的 一 组 比特 。 
变量 是 一 个 命名 过 的 对 象 。 
声明 是 命名 一 个 对 象 的 一 条 语句 。 

。 定义 是 为 一 个 对 象 分 配 内 存 空 间 的 声明 。 

我 们 可 以 非 正式 地 将 一 个 对 象 看 做 一 个 盒子 , 我 们 可 以 将 指定 类 型 的 值 放 入 这 个 盒子 
int 盒子 可 以 保存 整数 , 例如 7、42 与 -399。 一 个 string 盒子 可 以 保存 字符 串 值 , 例如 " Us 
bility" 、"tokens: ! @#$ 2% 人 "与 "01d McDonald had a farm" 。 我 们 可 以 生动 地 将 它 想象 为: 
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inta= 7; a | 
int b = 9; b: 
char c = 'a'; c: [a 


double x = 1.2; x: 





string s1 = "Hello, World!"; sl: 
string S2 = "1.2"; $2: 


由 于 string 要 跟踪 它 保存 的 字符 数 , 因此 string 比 int 的 表示 方法 更 复杂 。 注 意 , 一 个 double 保存 
一 个 数字 , 而 一 个 string 保存 多 个 字符 。 例 如 , x 保存 数字 1.2, 而 s2 保存 三 个 字符 '1'、'. ' 与 228 
字符 的 单 引 号 和 字符 串 常量 并 不 保存 。 

每 个 int 的 大 小 是 相同 的 。 也 就 是 说 , 编译 器 为 每 个 int 分 配 相同 的 固定 大 小 的 内 存 。 在 一 个 
典型 的 台式 电脑 中 , 这 个 大 小 是 4 个 字 节 (32 个 比特 ) 。 与 此 类 似 ，bool 、ehar 与 double 是 固定 大 
小 的 。 在 通常 情况 下 , 你 会 发 现 台 式 电脑 为 一 个 bool 或 一 个 char 分 配 1 个 字 节 (8 个 比特 ), 为 一 
个 double 分 配 8 个 字 节 。 注 意 , 不 同类 型 的 对 象 使 用 不 同 大 小 的 空间 。 特 别 地 , 一 个 char 比 一 个 
int 占用 更 少 的 空间 ，string 不 同 于 double 、int 与 char, 不 同 大 小 的 字符 串 占 用 不 同 大 小 的 空间 。 

在 内 存 中 比特 的 含义 完全 依赖 于 访问 它 时 所 用 的 类 型 。 我 们 这 样 考虑 : 计算 机 内 存 不 知道 我 
们 的 类 型 ， 只 是 将 它 保存 起 来 。 只 有 当 我 们 决定 内 存 如 何 解 释 时 , 在 内 存 中 的 比特 才 有 意义 。 这 
个 过 程 与 我 们 每 天 使 用 数字 相似 。12.5 的 含义 是 什么 ? 我 们 并 不 知道 。 它 可 以 是 $ 12.5、 
12. Sem 或 12. 5gallons。 只 有 当 我 们 使 用 单位 时 , 才 会 定义 12. 5 的 含义 。 

例如 ， 当 值 120 表示 的 是 一 个 int, 而 值 'x' 表 示 的 是 一 个 char 时 , 它们 在 内 存 中 的 比特 值 相 
同 。 如 果 我 们 将 它 看 成 一 个 string, 它 将 不 会 有 意义 , 并 在 我 们 试图 使 用 它 时 出 现 运 行 错误 。 我 们 
可 以 像 下 面 这 样 生动 地 解释 它 , 使 用 1 和 0 表示 内 存 中 的 比特 值 : 





这 是 一 个 内 存 区 域 (一 个 字 ) 中 的 一 组 比特 , 它们 可 以 被 读 取 为 一 个 int(120) 或 一 个 char('x', 只 
看 最 右 侧 的 8 个 比特 ) 。 一 个 比特 是 计算 机 中 的 一 个 内 存单 元 , 它 可 以 保存 一 个 值 0 或 1。 想 理解 
二 进 制 数 的 含义 , 见 A. 2. 1. 1 节 。 


3.9 类 型 安全 


每 个 对 象 在 定义 时 被 分 配 一 个 类 型 。 对 于 一 个 程序 或 程序 的 一 个 部 分 ， 如 果 使 用 的 对 象 符合 
它们 规定 的 类 型 , 那么 它们 是 类 型 安全 的 。 不 幸 的 是 ,有 很 多 执行 操作 的 方式 不 是 类 型 安全 的 。 
例如 , 在 一 个 变量 没有 初始 化 之 前 使 用 它 , 则 认为 不 是 类 型 安全 的 : 


int main() 


double x; ~ /1/ we “forgot’ to initialize: 


// the value of x is undefined 
double y = x; // the value of y is undefined 
double z = 2.0+x; // the meaning of + and the value of z are undefined 


} 
当 使 用 没有 初始 化 的 x 时, 一 个 实现 甚至 被 允许 出 现 一 个 硬件 错误 。 记 得 初始 化 你 的 变量 ! 这 个 
规则 的 例外 只 有 很 少 ( 非常 少 ) , 例如 我 们 立即 将 一 个 变量 作为 输入 操作 的 目标 , 但 是 记 住 初始 化 
变量 是 一 个 好 习惯 , 它 会 为 我 们 减少 很 多 的 麻烦 。 
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完全 的 类 型 安全 是 最 为 理想 的 , 因此 它 对 语言 来 说 应 是 一 般 规 则 。 不 地 的 是 , C++ 编译 器 不 
能 保证 完全 的 类 型 安全 , 但 是 通过 良好 的 编码 训练 和 运行 时 检查 , 我 们 可 以 避免 违反 类 型 安全 。 
理想 状态 是 永远 不 要 使 用 编译 器 也 不 能 保证 是 安全 的 语言 功能 : 静态 类 型 安全 。 不 幸 的 是 ,这 对 
于 大 多 数 有 趣 的 编程 应 用 过 于 严格 。 一 种 显然 的 退 而 求 其 次 的 方法 是 , 由 编译 器 隐 式 生成 代码 ， 
检查 是 否 有 违反 类 型 安全 的 情况 并 捕获 它们 , 但 这 已 超出 了 C++ 的 能 力 。 当 我 们 决定 做 (类 型 ) 
不 安全 的 事 时 , 我 们 必须 自己 做 相应 的 检查 工作 。 当 我 们 在 本 节 中 遇 到 这 种 情况 时 , 我 们 将 会 指 
出 来 。 

类 型 安全 的 思想 在 编写 代码 时 非常 重要 。 这 是 我 们 在 前 面 章节 花费 时 间 介 绍 它 的 原因 。 请 
注意 陷阱 并 避 开 它们 。 
3. 9. 1 安全 类 型 转换 

在 3.4 节 中 , 我 们 发 现 不 能 直接 将 char 相 加 , 或 者 将 一 个 double 与 一 个 int 比较 。 但 是 ， 
C++ 提供 间接 方式 来 完成 这 些 操 作 。 在 有 必要 时 , 一 个 char 可 以 转换 成 一 个 int, 而 一 个 int 也 可 
以 转换 成 一 个 double。 例 如 : 

char c = 'x'; 


intid = c; 
int i2 = x'; 


这 里 的 让 和 认 都 被 赋值 为 120, 它 是 字符 'x' 在 大 多 数 常 见 的 8 比特 字符 集 (例如 ASCII) 中 的 整 
数值 。 这 是 一 个 简单 和 安全 的 方法 , 通过 它 可 以 获得 一 个 字符 的 数字 表示 。 由 于 没有 信息 丢失 ， 
我 们 称 这 种 char-int 的 转换 为 安全 的 。 也 就 是 说 , 我 们 可 以 将 int 结果 拷贝 到 一 个 char 中 , 并 且 得 
到 原始 的 值 : 


char c2 = i1; 
cout << C << <<i<< :<< C2 << Nn'; 
这 里 将 会 打印 
x 120 x 
在 这 种 情况 下 , 一 个 值 总 是 被 转换 成 一 个 等 价 的 值 , 或 者 一 个 最 接近 等 价 的 值 (对 于 double) , 那 
么 这 些 转 换 就 是 安全 的 : 
bool 到 char 
bool 到 int 
bool 到 double 
char 到 int 
char 到 double 
int 到 double 
最 常用 的 转换 是 从 int 到 double, 这 是 由 于 它 允 许 在 表达 式 中 混合 使 用 int 和 double : 


double d1 = 2.3; 

double d2 = d1+2;  //2 is converted to 2.0 before adding 

if (d1 < 0) // 0 is converted to 0.0 before comparison 
error("d1 is negative'); 


对 于 一 个 确实 很 大 的 整数 ， 当 它 被 转换 成 double 时 , 我 们 (在 有 些 计算 机 中 ) 可 能 承受 一 些 精 度 上 
的 损失 。 这 种 情况 不 是 很 常见 。 
3. 9. 2 不 安全 类 型 转换 

安全 的 转换 对 程序 员 通常 是 一 个 福音 , 它 可 以 简化 编写 代码 的 过 程 。 不 幸 的 是 , C++ 也 允许 
( 隐 式 的 ) 不 安全 转换 。 所 谓 的 不 安全 , 我 们 指 的 是 一 个 值 可 以 转换 成 一 个 其 他 类 型 的 值 , 这 个 值 
不 等 于 原始 的 值 。 例 如 : 
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int main() 

{ 
int a = 20000; 
charc=a; /try to squeeze a large int into a small char 
int b = ¢; 


ia!=b) /Wi= means “not equal” 

cout << "00ps!: " <<a<< "1="<<b<<An'; 
else 

cout << "Wow! We have large charactersw ; 


} 
这 种 转换 又 称 为 “缩小 " 转换, 这 是 由 于 它们 将 一 个 值 放 入 一 个 对 象 ， 而 这 个 对 象 大 小 难以 存放 这 
个 值 。 不 幸 的 是 , 只 有 少数 编译 器 会 警告 将 char 初始 化 为 int 的 不 安全 。 问 题 是 一 个 int 通常 比 一 
个 char 大 , 因此 (在 这 种 情况 下 ) 它 可 以 保存 一 个 int 值 ,但 是 这 个 值 并 不 能 表示 为 一 个 char。 尝 
试 执行 这 个 程序 , 查看 你 计算 机 中 的 值 b( 常见 的 结果 是 32) 。 更 进一步 , 完成 实验 : 
int main(} 
double d =0; 
while (cin>>d){ /repeat the statements below 
/as long as we type in numbers 
int i = d; // try to squeeze a double into an int 


charc=i; /try to squeeze an int into a char 
int ji2 = c; / get the integer value of the character 


cout << "d==" <<d /the original double 
<< 1 i=="<< ji // converted to int 
<< "12==" <<i2 // int value of char 


<<" char( <<c<e "nNn"; /thechar 
} 
} 


我 们 使 用 while 语句 允许 尝试 很 多 值 , 这 个 语句 将 在 4.4.2. 1 节 中 解释 。 
试 一 试 输入 各 种 各 样 的 值 来 运行 这 个 程序 。 尝 试 小 的 值 (例如 2 和 3); 尝试 大 
的 值 ( 大 于 127 和 大 于 1000); 尝试 负 值 ; 尝试 56; 尝试 89; 尝试 128; 党 试 非 整 数值 
(例如 56.9 和 56.2)。 另 外 , 如 何在 你 的 机 器 中 从 double 转换 成 int, 以 及 如 何 从 int 
转换 成 char。 本 程序 将 显示 , 对 一 个 给 定 的 整数 值 ， 你 的 机 器 将 打印 什么 字符 ( 如果 
存在 的 话 )。 
你 将 发 现 很 多 输入 值 产生 “不 合理 ”的 结果 。 基 本 上 , 我 们 是 在 尝试 将 1 加 仑 水 倒 人 容量 为 1 品 脱 


的 桶 中 (大 约 是 将 4 升水 倒 人 一 个 500 毫升 的 杯子 ) 。 
double 到 int 
double 到 char 
double 到 bool 
int 到 char 
int 到 bool 
char 到 bool 


所 有 这 些 转换 被 编译 器 接受 ， 即 使 它们 是 不 安全 的 。 所 谓 不 安全 是 指 它们 保存 的 值 可 能 与 被 赋予 


的 值 不 同 。 为 什么 这 会 是 个 问题 ? 这 是 由 于 我 们 经 常 不 会 怀疑 一 个 不 安全 的 转换 会 发 生 。 考 虑 : 
double x = 2.7; 
// lots of code 
int y= x; ly becomes 2 


在 我 们 定义 y 时 可 能 忘记 x 是 一 个 double, 或 者 我 们 临时 忘记 double 到 int 转换 会 截 短 ( 总 是 去 掉 
小 数 点 后 的 尾数 ), 而 不 是 使 用 常用 的 四 舍 五 人 。 发 生 的 事情 是 完全 可 以 预测 的 , 但 是 在 int y = 
x; 处 没有 任何 东西 能 提醒 我 们 信息 (.7) 被 丢掉 了 。 
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从 int 到 char 的 转换 不 会 出 现 截 短 的 问题 ,int 和 char 都 不 能 表示 一 个 整数 的 一 部 分 。 但 是 ， 
一 个 char 只 能 保存 非常 小 的 整数 值 。 在 一 台 PC 机 中 , 一 个 char 占用 1 个 字 
节 , 而 一 个 int 占用 4 个 字 节 , 如 右 图 所 示 。 因 此 , 我 们 不 能 将 一 个 大 的 数 
(例如 1000) 放 人 一 个 int 而 不 丢失 任何 信息 : 这 个 值 是 缩小 的 。 例如 


inta = 1000; 
char b=a; //b becomes -24 (on some machines) 


不 是 所 有 的 int 值 都 有 等 价 的 char, 而 char 值 的 确切 范围 依赖 于 特定 的 实现 。 在 一 台 PC 机 中 ， 
char 值 的 范围 是 [ - 128: 127] , 但 是 只 有 [0, 127] 可 以 方便 地 移植 。 这 是 由 于 并 不 是 每 台 计 算 机 
都 是 PC 机 , 不 同 计算 机 的 char 值 的 范围 不 同 , 例如 [0: 255] 。 

为 什么 人 们 接受 缩小 转换 的 问题 ? 主要 原因 是 历史 性 的 : C++ 从 它 的 前 辈 语言 C 继承 了 缩小 转 
换 , 因此 从 C++ 出 现时 很 多 代码 就 依赖 于 缩小 转换 。 很 多 这 种 转换 实际 上 不 会 引起 问题 , 这 是 由 于 
它们 所 涉及 的 值 碰巧 在 范围 内 , 并 且 很 多 程序 员 反对 编译 器 “告诉 它们 做 什么 "。 特 别 是 对 有 经 验 的 
程序 员 来 说 , 这 些 不 安全 转换 问题 在 小 的 程序 中 是 可 管理 的 。 它 们 在 大 的 程序 中 可 能 是 错误 的 来 
源 , 并 且 是 一 个 新 程序 员 出 现 问题 的 重要 原因 。 但 是 ,编译 器 可 以 对 多 数 的 缩小 转换 发 出 警告 

如 果 你 认为 转换 可 能 导致 一 个 错误 值 , 那么 你 需要 做 什么 ? 在 我 们 做 本 节 中 的 第 一 一 个 例子 
时 ,你 在 赋值 之 前 要 简单 检查 这 个 值 。5. 6.4 节 与 7.5 节 介 绍 做 这 种 检查 的 简单 方式 。 


避 》 简单 练习 


在 完成 这 个 练习 的 所 有 步骤 之 后 , 运行 你 的 程序 以 确认 它 确 实在 做 你 希望 它 做 的 事 。 列 出 那些 曾经 出 

现 的 错误 , 这 样 以 后 可 以 尽量 避免 它们 。 

. 这 个 练习 是 编写 一 个 程序 , 基于 用 户 输入 生成 一 封 简单 格式 的 信 。 首 先 , 输入 来 自 3. 1 节 的 代码 , 提示 用 
户 输入 他 或 她 的 名 字 , 并 且 输 出 “Hello, first_name”, 这 里 的 first_name 是 用 户 输入 的 名 字 。 然 后 , 按 以 下 
要 求 修 改 你 的 代码 : 将 提示 修改 为 “Ehter the name of the person you want to write to”, 并 将 输出 修改 为 
“Dear first_name,，。 不 要 忘记 去 号 。 ee 

2 有 例如 “How are you? I am fine. I miss you. “确定 首 行 需要 缩 进 。 增 加 由 你 选择 的 几 

行 , 这 是 你 的 信 。 

. 提示 用 户 输入 另 一 个 朋友 的 名 字 ， 并 将 它 保存 在 friend_name 中 。 在 你 的 信 中 增加 一 行 :“ Have you 
seen first_name lately?” 

4. 声明 一 个 名 为 fiend_sex 的 char 变量 , 并 将 它 的 值 初始 化 为 0。 如 果 这 个 朋友 是 男性 , 提示 用 户 输入 一 个 
m; 如 果 这 个 朋友 是 女性 , 提示 用 户 输入 一 个 f。 为 变量 位 end_sex 分 配 输入 值 。 然 后 ， 使 用 两 个 让 语句 完 
成 以 下 输出 : 

如 果 这 个 朋友 是 男性 , 输出 “If you see friend_sex please ask him to call me. ”。 
如 果 这 个 朋友 是 女性 , 输出 “If you see friend_sex please ask her to call me. ”。 

5. 提示 用 户 输 入 收 信 人 的 年 岭 , 并 为 它 分 配 一 个 int 变量 age。 让 你 的 程序 输出 “I hear you just had a birthday 
and you are age years old. ”如 果 age 小 于 等 于 0 或 大 于 等 于 110, 调用 eror(" you'r kidding!1" )。 

6. 在 你 的 信 中 增加 下 面 的 内 容 : 

如 果 你 朋友 的 年 龄 小 于 12 , 输出 “Next year you will be age +1.”。 

如 果 你 朋友 的 年 龄 等 于 17, 输出 “Next year you will be able to vote. ”。 

如 果 你 朋友 的 年 龄 大 于 70, 输出 “I hope you are enjoying retirement. ”。 
7. 添加 “Yours sincerely, ”接着 是 两 个 空 行 , 后 面 是 你 的 名 字 。 


人 <》 思考 题 
1. 术语 prompt 的 含义 是 什么 ? 
2. 哪 种 操作 符 用 于 读 取 值 并 存 和 人 变量 中 ? 





char: be 


int: -EE 





和 


Ww) 


<“ 加 th 让 
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. 如 果 你 希望 用 户 在 你 的 程序 中 为 一 个 命名 为 number 的 变量 输入 一 个 整数 值 ， 如 柯 用 两 行 代码 来 完成 它 并 


将 值 输 入 你 的 程序 中 ? 


-An 的 名 称 是 什么 和 它 的 目的 是 什么 ? 
.怎样 终止 输入 一 个 字符 串 ? 

.怎样 终止 输入 一 个 整数 ? 

. 如 何 将 你 书写 的 


cout << "Hello, "; 
Cout < first_names; 
cout << "I\n"; 


作为 一 行 代 码 来 输入 ? 


8. 
9. 





对 象 是 什么 ? 
文字 常量 是 什么 ? 


.C++ 中 有 哪 几 种 文字 常量 ? 
.变量 是 什么 ? 


一 个 char、int 和 double 的 典型 大 小 是 多 少 ? 


.我 们 用 哪 种 方式 测试 内 存 中 的 小 实体 (例如 int 和 string) 的 大 小 ? 

.操作 符 = 与 == 之 间 的 区 别 是 什么 ? 

. 定义 是 什么 ? 

: 什么 是 一 次 初始 化 , 它 和 一 次 赋值 的 区 别 是 什么 ? 

， 什 么 是 字符 串 连 接 ， 如 何 使 它 在 C++ 中 正确 工作 ? 

. 在 以 下 名 字 中 , 哪些 在 C++ 中 是 合法 的 ? 如 果 一 个 名 字 是 不 合法 的 ， 为 什么 ? 


This_little_pig This_1_is fine 2 For 1_special 
latest thing the_$12_method _this_is_ok 
MiniMineMine number correct? 


， 请 举 出 5 个 容易 引起 混 消 、 你 不 会 使 用 的 合法 名 字 。 
.选择 名 字 的 好 规则 有 哪些 ? 
. 什么 是 类 型 安全 , 为 什么 它 是 重要 的 ? 
. 为 什么 从 double 转换 成 int 是 一 件 坏事 ? 
23. 请 定义 一 个 协助 判断 从 一 种 类 型 到 另 一 种 类 型 的 转换 是 否 安全 的 规则 。 


DA 


定义 运算 cin 递增 运算 符 
初始 化 类 型 转换 名 字 类 型 安全 
缩小 值 递减 对 象 变量 


。 如 果 你 还 没有 开始 这 样 做 ' 请 先 做 本 章 的 “ 试 一 试 ” 练习 在 
:编写 一 个 C++ 程序 , 将 英里 转换 成 公里 。 你 的 程序 应 该 有 一 个 合理 的 提示 ,要求 用 户 输入 一 个 表示 英里 


的 数字 。 提 示 : 这 里 是 1. 609 公里 要 转换 成 英里 。 


. 编写 一 个 程序 , 不 做 其 他 的 任何 事情 ， 只 声明 一 系列 合法 与 不 合法 的 变量 名 (例如 int double =0;), 这 样 


你 可 以 看 到 编译 器 的 反应 。 


. 编写 一 个 程序 ,提示 用 户 输入 两 个 整数 值 。 将 这 些 值 保存 在 int 变量 vall 和 val2 中 。 编 写 程序 决定 这 些 


值 中 的 最 小 值 、 最 大 值 、 和 、 差 、 乘 积 和 比率 , 并 且 将 它们 报告 给 用 户 。 


.修改 上 面 程序 , 让 用 户 输入 浮 点 数值 并 将 它们 保存 在 double 变量 中 。 比 较 你 选择 的 多 种 输入 在 两 个 程序 


的 输出 。 这 些 结果 是 否 相同 ? 它们 是 否 对 ? 区别 是 什么 ? 


. 编写 一 个 程序 , 提示 用 户 输入 三 个 整数 值 , 然后 按 数值 次 序 输出 这 些 值 并 以 逗号 隔 开 。 因 此 , 如 果 用 户 


输入 值 为 1046, 输出 值 为 4, 6, 10。 如 果 有 两 个 值 相 同 , 那么 将 它们 连续 输出 。 因 此 , 输入 45 4 将 会 输 
出 4, 4, 5。 
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10. 


. 重 做 练习 6, 但 是 输入 3 个 字符 串 。 因 此 ， 如 果 用 户 输入 “Steinbeck”“Hemingway” 和 “Fitzgerald”,， 输出 


将 是 “Fitzgerald ，Hemingway ，Steinbeck ”。 


. 编写 一 个 程序 , 测试 一 个 整数 值 是 奇数 还 是 偶数 。 记 住 确认 你 的 输出 是 清楚 和 完整 的 。 换 名 话说 , 不 要 


只 是 输出 “yes ”或 “no"。 你 的 输出 应 该 是 独立 的 , 例如 “The value 4 is an even number. ”提示 : 阅读 3.4 节 
中 的 余数 ( 模 ) 操 作 。 


， 编写 一 个 程序 , 将 数字 的 英文 单词 (例如 “zero” 和 “two” ) 转 换 成 数字 (例如 0 和 2) 。 当 用 户 输入 一 个 数字 


的 英文 拼写 , 程序 将 打印 出 对 应 的 数字 。 针 对 数值 0、1、2、3 和 4 完成 这 个 操作 , 如 果 用 户 输入 无 法 对 应 
的 值 (例如 “stupid computer!1”) , 程序 输出 “not a number I know”。 
编写 一 个 程序 , 执行 一 个 包括 两 个 运算 的 操作 , 然后 输出 结果 。 例 如 : 
+ 100 3.14 
$45 
将 操作 读 入 一 个 字符 串 称 为 operation， 用 一 个 主语 名 判断 哪个 操作 是 用 户 和 希望 的 , 例如 ff (operation = 
=" +")。 将 运算 读 和 人 double 类 型 的 变量 。 实 现 这 些 称 为 + 、- 、* 、/ 的 操作 , 加 、 减 、 乘 、 除 都 有 各 自 
明显 的 意义 。 


. 编写 一 个 程序 , 提示 用 户 输入 一 美 分 (1 美 分 硬币 ) 、 五 美 分 (5 美 分 硬币 ) 、 十 美 分 (10 美 分 硬币 ) 、 二 十 


五 美 分 (25 美 分 硬币 )、 半 美元 (50 美 分 硬币 ) 和 一 美元 (100 美 分 硬币 ) 的 数量 。 对 每 种 面值 的 硬币 , 分 
别提 示 用 户 输入 其 数量 , 例如 “How many pennies do you have?” 然 后 , 程序 将 输出 类 似 下 面 的 内 容 : 

You have 23 pennies. 

You have 17 nickels. 

You have 14 dimes. 

You have 7 quarters. 

You have 3 half dollars. 

你 可 能 需要 发 挥 想 象 力 才 能 将 合计 值 右 对 齐 输出 , 但 请 尽力 尝试 , 你 可 以 完成 它 。 然 后 做 出 一 些 改 进 : 
如 果 某 个 面值 只 有 一 枚 硬币 , 确保 输出 语法 是 正确 的 , 例如 , 应 输出 “14 dimes” 和 “1 dime” (而 不 是 “1 
dimes”) 。 另 外 , 将 合计 值 用 美元 和 美 分 来 表示 , 例如 用 $ 5.73 来 代替 573 美 分 。 


必 》 附 言 


请 不 要 低估 类 型 安全 概念 的 重要 性 。 类 型 是 大 多 数 正 确 程序 的 核心 概念 , 大 多 数 用 于 构建 程序 的 有 效 


技术 依赖 于 类 型 的 设计 与 使 用 , 正如 我 们 将 在 第 6 章 、 第 9 章 、 第 二 部 分 、 第 三 部 分 、 第 四 部 分 中 看 到 的 
一 样 。 


第 4 章 计 算 


“如 果 不 要 求 结 果 的 正确 性 , 我 可 以 让 程序 运行 得 任意 快 ”。 
Gerald M. Weinberg 





本 章 将 介绍 一 些 与 计算 相关 的 基本 概念 。 我 们 将 着 重 讨论 如 何 通 过 一 系列 指令 来 计算 一 个 
数值 量 (表达 式 ); 如 何在 可 替代 操作 中 进行 选择 (选择 ); 如 何 对 一 系列 数据 进行 重复 计算 ( 选 
代 )。 此 外 , 我 们 还 将 介绍 一 种 可 以 被 单独 划分 出 来 的 计算 操作 ( 函数 ) 。 本 章 内 容 的 核心 是 通过 
介绍 计算 让 读者 能 够 编写 出 正确 而 且 规 范 的 程序 。 为 了 让 读者 更 好 地 理解 计算 , 我 们 将 引入 向 量 
这 一 概念 来 表示 数据 序列 。 


4. 1 计算 


有 一 种 观点 认为 , 程序 就 是 以 计算 为 目的 的 , 即 程 序 都 要 有 输入 和 输出 。 在 这 里 , 我 们 把 能 
够 运行 程序 的 硬件 设备 称 为 计算 机 。 如 果 我 们 用 广义 的 
概念 来 理解 输入 和 输出 的 话 ,那么 上 述 的 观点 可 以 认为 
是 正确 的 。 程 序 的 输入 来 源 有 很 多 : 可 以 是 键盘 、 鼠 标 、 
触摸 屏 、 文 件 、 其 他 输入 设备 、 其 他 程序 , 或 者 同一 程序 
的 其 他 部 分 。 在 这 里 ,“ 其 他 输入 设备 ”的 范围 很 广 , 它 表示 了 一 大 类 实际 输入 设备 : 音乐 键盘 、 
摄像 机 、 网 络 设备 、 温度 传感器 、 数 字 图 像 传感器 等 。 随 着 技术 的 进步 , 输入 设备 可 以 千变万化 。 

为 了 处 理 输入 , 程序 通常 包含 一 些 数据 ,有 时 称 为 程序 的 数据 结构 或 程序 的 状态 。 例 如 , 日 
历程 序 需 要 记录 不 同 国家 的 公共 假期 和 用 户 的 事务 安排 表 。 这 些 数据 一 部 分 是 在 程序 中 设 定好 
的 , 还 有 一 部 分 是 在 程序 运行 期 间 , 程序 通过 各 种 输入 设备 获取 的 。 例 如 , 通过 用 户 的 输入 , 日 
历程 序 可 以 准确 地 建立 用 户 的 事务 安排 表 。 对 于 一 个 日 历程 序 来 说 , 主要 输入 包括 对 日 期 的 查询 
(一 般 通 过 鼠标 点 击 ) 和 对 用 户 事务 安排 表 的 处 理 ( 通 常 使 用 键盘 输入 相关 信息 )。 输 出 包括 日 历 
和 事务 安排 表 的 显示 、 加 上 按钮 和 提示 符 显 示 等 。 

输入 的 来 源 非常 广泛 。 同 样 , 输出 也 有 很 多 不 同 的 途径 : 可 以 是 屏幕 、 文 件 以 及 其 他 设备 ， 
或 者 其 他 程序 , 甚至 可 以 是 同一 程序 的 其 他 部 分 。 输 出 设备 很 多 , 例如 网 络 接口 、 音 乐 合成 器 、 
电动 马达 、 发 光 器 和 加 热 器 等 。 

从 编程 的 角度 看 ,最 重要 也 是 最 有 趣 的 两 类 输入 、 和 输出 是 从 其 他 程序 输入 或 输出 ”和 “从 同 
一 程序 的 其 他 部 分 输入 或 输出 ”。 本 书后 续 的 大 部 分 内 容 可 以 视 为 后 一 种 类 型 的 实例 : 在 协作 完 
成 一 个 大 的 软件 时 , 应 该 如 何 合理 地 设计 程序 结构 , 并 能 够 保证 每 一 个 子 程序 之 间 都 能 够 正确 地 
共享 和 交换 数据 ? 这 是 编程 的 核心 问题 , 下 图 说 明了 这 一 过 程 : 


Hirt 









tt 
| 







Ea 
E32227 
FS 
人 
F344 和 2 
E3744 
FERN 
Est 
2 


EE 
| 
| 

Ee 


ri 


其 中 , 1/O 是 “inputyoutput" 的 缩写 。 在 图 中 ,一 部 分 代码 的 输出 是 下 一 部 分 代码 的 输入 。 而 
子 程序 之 间 的 数据 共享 可 以 通过 内 存 、 非 易 失 存储 设备 (例如 硬盘 ) 或 者 网 络 完成 。 在 这 里 ,“ 子 
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程序 "是 指 程序 中 的 各 类 函数 , 包括 根据 输入 参数 产生 输出 结果 的 函数 (例如 求 浮 点 数 的 平方 根 辐 
数 )， 和 或 者 修改 现 有 程序 数据 表 的 函数 
(例如 在 顾客 信息 表 中 增加 一 个 名 字 )。 

通常 意义 上 的 “输入 ”和 “输出 ”是 指 信息 进入 和 离开 计算 机 。 正 如 前 文 所 述 , 也 可 以 将 “ 输 
入 ”和 “输出 ”引入 到 子 程序 的 数据 传递 。 通常, 子 程序 的 输入 称 为 参数 , 子 程 序 的 输出 称 为 结果 。 

从 这 个 意义 上 来 说 , 计算 就 是 基于 输入 生成 输出 的 过 程 。 例 如 ,基于 参数 7( 输 入 ), 计算 过 程 
square( 函数 ) 可 以 得 到 结果 和 9( 输 出 ) (具体 细 节 参 见 4.5 节 )。 有 趣 的 是 , 直到 20 世纪 50 年 代 , 计 
算 机 的 定义 还 是 一 个 从 事 计 算 任务 的 人 , 例如 会 计 、 导 航 员 或 物理 学 家 。 今天 , 人 类 社会 的 大 部 分 
计算 任务 都 是 由 各 种 类 型 的 计算 机 (真正 的 机 器 ) 完 成 的 。 日 常生 活 中 最 常见 的 就 是 计算 器 了 。 


4.2 目标 和 工具 


程序 员 的 任务 就 是 将 计算 表示 出 来 , 并 且 做 到 : 

。 正确 

。 简单 

。 高 效 
请 注意 上 述 顺序 。 一 个 输出 错误 结果 的 快速 程序 是 没有 任何 意义 的 。 同 样 , 一 个 正确 、 高 效 但 是 
非常 复杂 的 程序 , 最 终 的 结果 往往 是 被 放弃 或 者 重 写 。 记 住 , 为 了 适应 不 同 的 需求 和 硬件 环境 ， 
有 用 的 程序 总 会 被 无 数 次 改写 。 因 此 , 一 个 程序 , 或 者 它 的 任 一 子 程序 , 应 该 以 尽 可 能 简单 的 方 
式 来 实现 。 举 个 例子 , 假设 你 为 学 校 的 孩子 写 了 一 个 非常 棒 的 算术 教学 程序 , 而 这 个 程序 的 内 部 
组 织 非 常 糟 糕 。 这 个 程序 必须 与 孩子 们 交互 , 那 你 应 该 用 什么 语言 呢 ? 英语 ? 英语 和 西班牙 语 ? 
如 果 程 序 要 在 芬兰 或 科威特 用 , 那 又 该 怎么 办 呢 ? 无 疑 , 为 了 能 适应 不 同 地 区 的 需要 , 程序 使 用 
的 交互 语言 必须 能 够 被 修改 。 如 果 程 序 的 结构 是 非常 混乱 的 话 , 原本 多 辑 上 很 简单 的 (但 实际 中 
总 是 很 困难 的 ) 修 改 操作 会 变 成 一 项 艰巨 的 任务 。 

在 我 们 开始 编写 代码 的 时 候 , 就 要 特别 关注 正确 、 简 单 和 高 效 这 三 个 基本 原则 ,这 也 是 专业 
程序 员 的 最 重要 职责 。 在 实际 工作 中 , 遵循 这 些 原则 意味 着 代码 仅仅 能 用 是 不 够 的 , 我 们 必须 认 
真 考虑 代码 的 结构 。 一 个 看 似 矛 盾 的 事实 是 , 关注 代码 结构 和 “代码 质量 ”是 程序 取得 成 功 的 最 快 
途径 。 这 一 点 很 好 理解 ， 编 程 时 对 编码 结构 和 质量 所 付出 的 努力 , 可 以 大 大 简化 最 令 人 诅 丧 的 编 
程 工作 : 调试 。 这 是 因为 好 的 程序 结构 不 但 可 以 减少 错误 的 发 生 , 而 且 还 能 缩短 发 现 并 改正 错误 
的 时 间 。 

程序 的 组 织 体现 了 程序 员 的 编程 思路 ， 目 前 的 手段 主要 是 把 一 个 大 的 计算 任务 划分 为 许多 小 
任务 。 这 一 技术 主要 包括 两 类 方法 : 

。 抽象 ; 即 不 需要 了 解 的 程序 具体 实现 细节 被 隐藏 在 相应 的 接口 之 后 。 例 如 , 为 了 实现 电话 
德 的 排序 ,我 们 不 需要 了 解 排序 算法 的 细节 (已 经 有 很 多 书 讨论 如 何 排序 了 ) 。 我 们 要 做 
的 只 是 调用 C++ 标准 库 函 数 中 的 排序 函数 就 可 以 了 , 即 如 何 调 用 这 一 排序 晒 数 : 编号 sort 
(b, e), 这 里 b 和 e 分 别 指示 电话 夭 的 开始 和 结束 。 另 一 个 例子 是 内 存 的 使 用 ,直接 使 用 
内 存 空间 是 一 个 糟糕 的 想法 。 通 常 , 我 们 通过 变量 (参见 3.2 节 ))、 标 准 库 向 量 ( 参 见 4.6 
节 , 第 17 ~19 章 ) 和 映射 (参见 第 21 章 ) 等 来 访问 内 存 。 

e 分 治 : 把 一 个 大 问题 分 为 几 个 小 问题 分 别 解决 。 例 如 , 在 建立 一 个 字典 的 时 候 , 可 以 把 这 一 
任务 分 解 为 三 个 子 任务 : 读数 据 、 数 据 排序 和 输出 数据 , 每 个 子 任务 都 明显 小 于 原来 的 任务 . 
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这 人 么 做 有 什么 用 呢 ? 毕竟 , 由 很 多 部 分 构成 的 程序 要 比 一 个 完整 的 程序 规模 大 。 直 接 原 因 是 大 问 
题 处 理 起 来 太 困难 , 这 种 情况 不 只 存在 于 程序 设计 , 也 存在 于 很 多 其 他 领域 。 对 于 这 一 情况 , 我 
们 的 解决 办 法 是 将 问题 不 断 分 解 、 细 化 , 直到 问题 小 到 能 够 被 我 们 很 好 地 理解 和 解决 为 止 。 以 编 
程 为 例 , 一 个 1000 行程 序 的 规模 是 一 个 100 行程 序 的 10 倍 。 但 是 1000 行程 序 的 错误 会 远 超过 
100 行程 序 的 10 倍 。 解 决 的 办 法 就 是 把 这 个 1000 行程 序 分 解 为 多 个 子 程序 , 每 个 子 程序 不 超过 
100 行 。 对 于 大 型 软件 来 说 , 例如 一 个 1000 万 行 的 程序 , 使 用 抽象 和 分 治 等 技术 就 不 只 是 一 个 编 
程 建议 了 , 而 是 必须 这 样 做 。 编 写 并 维护 一 个 庞大 的 单一 程序 是 很 困难 的 。 对 于 本 书 剩余 的 内 
容 , 读者 不 妨 尝试 利用 已 有 的 工具 和 方法 , 把 一 些 大 问题 分 解 为 一 系列 小 问题 。 

在 考虑 划分 一 个 程序 前 , 我 们 首先 要 明确 手 里 有 了 哪些 工具 可 以 表示 各 个 子 程序 及 其 之 间 的 关 
系 。 这 是 因为 一 个 能 够 提供 充分 的 接口 和 功能 的 库 可 以 大 大 简化 程序 的 划分 工作 。 任 空想 象 什 
么 是 程序 的 最 优 划 分 方法 是 不 切实 际 的 , 按照 功能 对 程序 进行 划分 是 目前 最 常用 的 方法 。 无 疑 ， 
利用 已 有 的 各 类 程序 库 能 够 简化 按 功 能 进行 程序 划分 的 工作 量 。 事 实 上 , 利用 类 似 C++ 标准 库 
这 种 已 有 的 库 , 不 但 可 以 减少 编程 的 工作 量 , 而 且 可 以 减少 测试 和 写 文档 的 工作 量 。 例 如 ，iostre- 
ams 库 屏 蔽 了 IO 设备 的 实现 细节 。 程 序 员 可 以 直接 调用 相应 库 项 数 ， 而 不 需要 了 解 具 体 LO 接 
口 是 如 何 实现 的 , 这 就 是 抽象 方法 的 一 个 具体 实例 。 在 后 续 章 节 中 , 我 们 将 展示 更 多 例子 。 

请 注意 我 们 对 结构 和 组 织 的 强调 :要 写 出 好 的 程序 并 不 仅仅 是 堆砌 大 量 的 语句 。 我 们 为 什么 
在 此 刻 就 提 及 这 一 点 呢 ? 毕竟 这 对 于 你 (或 者 至 少 是 大 多 数 读 者 ) 来 说 有 些 早 ,你 此 时 对 代码 还 没 
什么 概念 , 写 出 其 他 人 能 用 于 实际 生活 的 代码 更 是 几 个 月 后 才 可 能 的 事情 。 我 们 之 所 以 这 么 早 就 
提 及 结构 和 组 织 的 重要 性 ,是 想 帮助 你 确立 正确 的 学 习 重 点 。 人 们 很 容易 禁不住 诱惑 ,一 头 扎 进 
具体 的 .能 立刻 显现 出 作用 的 程序 设计 技术 (如 本 章 剩余 部 分 所 介绍 的 那些 内 容 ) ,而 忽略 那些 “ 软 
知识 ”, 即 软件 开发 艺术 中 基础 概念 部 分 。 但 好 的 程序 员 和 系统 设计 者 知道 (通常 是 从 惨痛 的 教训 
中 学 会 的 ) ,对 结构 的 关注 是 好 软件 的 核心 ,而 忽视 结构 会 导致 严重 的 混乱 。 没 有 结构 ,你 就 是 在 
用 泥 砖 盖 房 子 。 虽 然 泥 砖 也 能 盖 房 子 , 但 绝 不 可 能 盖 起 五 层 高 楼 (因为 泥 砖 没 有 足够 的 结构 强度 
支撑 这 样 的 高 楼 ) 。 如 果 你 一 心 想 构建 能 长 久 留 存 的 东西 ,就 应 该 在 设计 过 程 中 对 代码 结构 和 组 
织 投入 更 多 的 关注 ,而 不 是 在 发 生 错 误 后 再 被 迫 回 过 头 来 关注 这 些 方面 。 


4.3 表达 式 


表达 式 是 程序 的 最 基本 组 成 单元 。 表 达 式 就 是 通过 一 系列 操作 来 计算 一 个 数值 量 。 最 简单 
的 表达 式 是 字面 常量 , 例如 10、'a'、3. 14 和 "Norah'" 。 
变量 名 也 是 一 种 表达 式 , 变量 表示 与 名 字 对 应 的 那个 对 象 。 例 如 


// compute area: 

int length = 20; // a literal integer (used to initialize a variable) 
int width = 40; 

int area = length*width; //a multiplication 


在 这 里 , 字面 常量 20 和 40 用 于 初始 化 变量 length 和 width。 然 后 ，length 和 width 进行 乘法 操作 ， 即 

length 和 width 所 表示 的 值 相 乘 。 这 时 候 ， length 表示 名 字 为 length 的 对 象 的 值 。 考 虑 如 下 情况 : 
length = 99; / assign 99 to length 

该 语句 中 的 length 位 于 赋值 符号 左边 ( 即 length 是 左 值 ), 其 含义 是 名 字 为 length 的 对 象 , 因此 赋 

值 表达 式 的 含义 是 “把 99 赋 给 名 为 length 的 对 象 ”"。 要 注意 区 分 length 用 于 赋值 操作 符 左 边 和 右 

边 的 含义 是 不 同 的 ,length 在 左边 时 ( 即 length 是 左 值 ) 表 示 “ 名 为 length 的 对 象 ”, 在 右边 时 ( 即 

length 是 右 值 ) 表 示 “ 名 为 length 的 对 象 的 值 ” 。 通 过 下 面 的 图 可 以 更 清楚 地 解释 这 个 概念 : 
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DR 
length: (Ss 0 
PREF OP A 


上 图 表示 了 一 个 名 为 length 的 整 型 对 象 , 其 值 为 9。 当 length 是 左 值 时 , length 表示 这 个 对 象 
本 身 ; 当 length 是 右 值 时 , length 表示 这 个 对 象 的 值 。 

我 们 还 可 以 使 用 运算 符 ( 如 + 和 x ) 表 示 更 复杂 的 表达 式 。 如 果 需 要 的 话 , 使 用 括号 还 可 以 构 
成 复合 表达 式 : 

int perimeter = (length+width)*2; /add then multiply 
如 采 没 有 括号 的 话 ， 表 达 式 必须 表示 为 : 

int perimeter = length*2+width*2; 
显然 , 这 种 表示 方法 很 繁琐 ， 而 且 容 易 出 错 : 

int perimeter = length+width*2;  //add width*2 to length 
这 个 语句 的 错误 是 语义 错误 而 不 是 语法 错误 , 编译 右 认 为 是 合法 的 , 该 语句 通过 一 个 有 效 的 表 这 式 初 
化 perimeter 变量 。 由 于 编译 器 不 清楚 perimeter 的 数学 定义 ,因此 编译 器 不 能 确定 表达 式 是 否 有 意义 。 

”按照 运算 符 的 优先 级 规则 ,length + width * 2 表示 length + (width *2), 同样, a* b + eyd 表示 

(a*b) +(c/d)，, 而 不 是 a* (b+c)/d。A.5 市 给 出 了 运算 符 优 先 级 表 。 

使 用 括号 的 第 一 条 原则 是 ”如果 对 运算 符 优先 级 不 确定 ,就 用 括号 ”。 当 然 , 要 尽量 熟悉 优先 
级 规则 , 像 a* b +e/d 这 种 简单 表达 式 还 加 括号 的 话 , 无 疑 会 降低 程序 的 可 读 性 。 

可 读 性 为 什么 这 么 重要 呢 ?” 因 为 程序 是 给 人 读 的 , 读者 可 能 是 编程 者 本 人 , 也 可 能 是 其 他 
人 。 丑陋 的 代码 不 但 会 降低 程序 的 可 读 性 和 可 理解 性 , 而 且 难 以 发 现 和 改正 程序 的 错误 , 因为 丑 
陋 的 代码 往往 会 导致 难以 发 现 其 中 的 语义 错误 , 难以 让 人 相信 它 是 正确 的 。 记 住 , 绝对 不 要 在 程 
序 中 使 用 非常 复杂 的 表达 式 。 例 如 : 

ar*b+crd*(e-ftgxXh+7 /too complicated 
另外 , 变量 的 命名 应 该 有 对 应 的 含义 。 
4. 3.1 常量 表达 式 

程序 中 经 常会 用 到 常量 。 例 如 , 一 个 与 几何 相关 的 程序 会 用 到 pi, 一 个 英寸 到 厘米 的 转换 程 
序 会 用 到 转换 系数 2.54。 显 然 , 常量 名 应 该 能 够 体现 它 的 含义 (例如 , 我 们 一 般 用 pi, 而 不 是 
3.14159)。 而 且 , 常量 的 值 也 不 应 该 经 常 改变 。 因 此 , 在 C++ 语言 中 提供 了 符号 常量 来 表示 那些 
在 初始 化 后 值 就 不 再 改变 的 数值 量 。 例 如 : 


const double pi = 3.14159; 
Pi = 7; / error: assignment to const 
intv = 2*pir; HAOK: we just read pi; we don'ttry to change it 


常量 对 于 维护 程序 的 可 读 性 具有 重要 作用 。 大 部 分 人 可 能 都 知道 3. 14159 表示 的 是 pi, 但 
299792458 表示 什么 就 没有 人 能 猜 到 了 。 进 一 步 讲 ,如 果 要 求 程序 把 pi 的 精度 提高 到 12 位 有 效 
数字 , 则 需要 改变 程序 中 所 有 用 到 pi 的 语句 。 一 种 可 行 的 方法 是 搜索 程序 中 所 有 包含 3. 14 的 地 
方 , 但 对 于 使 用 22/7 来 代替 pi 的 语句 就 搜索 不 到 了 。 因 此 , 最 好 的 方法 是 在 程序 中 只 有 一 个 定义 
pi 的 语句 , 其 他 用 到 pi 的 语句 都 使 用 该 常量 。 需 要 修改 pi 值 的 时 候 ， 只 修改 pi 的 定义 语句 即 可 : 
const double pi = 3.14159265359; 
因此 , 我 们 的 建议 是 : 除了 个 别 情况 (例如 0 和 1)， 程序 中 应 应 该 尽量 少 用 字面 常量 , 而 是 尽 可 能 地 
使 用 符号 常量 。 在 代码 中 , 这 种 不 能 直接 识别 的 字面 常量 通常 称 为 魔 数 (magic constant ) 。 
在 一 些 情况 下 ， 例 如 在 标号 中 (4.4.1.3 节 )，C++ 语 言 允 许 表 达 式 与 整数 组 合 构成 常量 表达 
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式 。 例如 ; 


const int max=17;  //a literal is a constant expression 
int val = 19; 


miax+2 //a constant expression (a const int plus a literal) 

val+2 I not a constant expression: it uses a variable 
顺便 说 一 下 , 299792458 是 一 个 基本 的 物理 常量 ; 它 是 光 在 真空 中 的 传播 速度 , 单位 是 米 / 秒 。 当 你 
不 知道 这 一 点 的 时 候 , 在 代码 中 看 到 这 个 字面 常量 肯定 会 犯 糊涂 。 因 此 , 要 避免 使 用 魔 数 。 
4. 3.2 运算 符 

到 目前 为 止 , 我 们 用 的 都 是 最 简单 的 运算 符 , 接 下 来 你 将 会 看 到 许多 复杂 运算 符 的 使 用 方法 。 
后 面 我 们 将 在 遇 到 运算 符 时 加 以 详细 描述 , 大 多 数 运算 符 都 很 好 理解 。 下 表 给 出 了 常用 的 运算 符 : 


名 称 说 明 
f(a) 函数 调用 a 做 为 函数 f 的 参数 
++ lval 前 增 变量 值 加 1 
—— lval 前 绥 减 变量 值 减 1 
la 非 结果 是 布尔 类 型 
-a 单 目 减 
a 上 b 乘 
a/b 除 
a%b 取 模 仅 用 于 整 型 
a+b 加 法 
a-b 减法 
out <<b 将 b 写 到 out out 是 ostream 对 象 
in >>b 从 in 中 读 取 数据 存 到 b 中 in 是 iatream 对 象 
a<b 小 于 结果 是 布尔 类 型 
a<=b 小 于 等 于 结果 是 布尔 类 型 
a>b 大 于 结果 是 布尔 类 型 
a>=b 大 于 等 于 结果 是 布尔 类 型 
a==b 等 于 不 要 与 赋值 混 请 
al =b 不 等 于 结果 是 布尔 类 型 
a&&b 有 逻辑 与 结果 是 布尔 类 型 
allb 逻辑 或 结果 是 布尔 类 型 
lval =a 赋值 不 要 与 等 于 混 清 
lval * =a 复合 赋值 等 价 于 lval = lval * a， 类 似 还 有 /、 各、+ 、- 


上 表 中 的 lval 表示 左 值 , 即 它 可 以 出 现在 赋值 号 左边 , 在 附录 A. 5 中 有 详细 介绍 。 

逻辑 运算 符 &&、11 和 ! 的 例子 可 以 分 别 在 5.5.1 节 、7.7 节 、7.8.2 节 和 10.4 节 中 找到 。 

需要 注意 的 是 , 表达 式 a<b <c 表示 (a <b) <c, a<b 的 结果 是 布尔 值 ; true 或 flse。 因 此 ， 
表达 式 a <b <c 的 值 等 于 true <c 或 者 false <c, 而 不 是 a <b <c 表示 “b 的 值 是 否 介 于 a 和 c 之 
间 ?”。 实 际 上 , 表达 式 a<b <c 是 没有 用 处 的 , 在 进行 比较 操作 时 , 千 万 不 要 写 出 这 样 的 表达 式 。 
如 果 在 别人 的 代码 中 发 现 了 这 种 表达 式 , 这 往往 意味 着 一 个 错误 。 

增 量 表达 式 至 少 有 以 下 三 种 形式 : 


寺 十 二 
到 二 三 1 
a=a+1 


哪 种 方式 比较 好 ? 为 什么 呢 ? 建议 使 用 第 一 种 方式 ++a, 它 直观 地 表示 了 增 量 的 含义 , 显示 了 我 
们 要 做 什么 (对 a 加 1), 而 不 是 怎么 做 (a 加 1, 然后 结果 写 到 a)。 通 常 , 我 们 认为 能 够 更 直接 地 
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体现 程序 思想 的 编程 方式 更 好 一 些 , 因为 这 种 方式 更 准确 , 并 且 更 容易 被 读者 理解 。 假 如 使 用 
a=a+1 的 话 , 读者 可 能 会 想 , 程序 的 原意 真 的 是 要 对 a 加 1 吗 ? 不 会 是 要 做 a=b+1、a =a+2 或 
者 a=a -1 但 输入 出 错 了 吧 ! 而 使 用 ++a 方 式 就 不 会 引起 这 样 的 疑问 。 需 要 注意 的 是 , 上述 只 讨 
论 程序 的 正确 性 和 逻辑 性 , 与 程序 的 效率 无 关 。 实 际 上 , 目前 的 编译 器 对 a=a+1 和 ++a 的 处 理 
是 一 样 的。 同样 , 我 们 建议 编程 时 使 用 a * = scale 而 不 是 a = a * scale。 
4. 3.3 ”类 型 转换 : : | 

表达 式 中 允许 存在 不 同 的 数据 类 型 。 例 如 , 2. 5/2 是 一 个 double 类 型 除 以 一 个 int 类 型 。 这 表 
示 什 么 呢 ? 我们 应 该 做 整 型 除法 还 是 双 精度 浮 点 型 除法 呢 ? 整 型 除法 时 余数 被 丢弃 , 例如 5/2 的 
结果 为 2。 浮 点 型 除法 时 余数 被 保留 , 例如 5.0/2.0 是 2.5。“2. 5/2 是 整 型 除法 还 是 浮 点 型 除 
法 ?” 的 答案 是 “ 浮 点 型 除法 , 因为 整 型 除法 会 丢失 余数 ”。 也 就 是 说 , 2. 5/2 的 结果 是 1. 25 而 不 是 
1。 我 们 遵循 这 样 的 规则 : 如 果 算术 表达 式 中 有 double 类 型 数据 的 话 , 就 进行 浮 点 型 算术 计算 , 结 

果 为 double 类 型 ; 否则 就 使 用 整 型 算术 计算 , 结果 为 int 类 型 。 例 如 : 


3/2 结果 是 2( 不 是 2.5) 
2.5/2 等 同 于 2. 5/double (2 ) 结果 是 1. 25 
'a'+1 等 同 于 int( a ) +1 


这 意味 着 编译 器 会 把 上 述 运算 中 的 int 自动 转换 为 double, 或 将 char 自动 转换 为 int。 在 运算 完成 
的 时 候 , 这 种 转换 也 已 经 完成 。 例 如 : 


double d = 2.5; 
int i = 2; 


double d2=d/ii; //d2 == 1.25 


int i2 = d/i; /i2 == 
d2 = dii; 1 d2 == 1.25 
= dii; fi2 == 


需要 特别 注意 浮 点 运算 表达 式 中 的 整数 除法 。 例 如 , 摄氏 温度 与 华氏 温度 的 转换 公式 为 : f=9/5 


+ Cc 十 32, 程序 代码 如 下 : 
double dc; 
cin >> de; 
double df = 9/5*dc+32; /1 beware! 


不 幸 的 是 , 上 述 程 序 不 能 正确 实现 摄氏 温度 与 华氏 温度 的 转换 功能 , 因为 9/5 的 值 是 1 而 不 是 我 


们 期 望 的 1.8。 如 果 要 达到 我 们 期 望 的 结果 ， 必须 将 9 或 5( 或 者 二 者 ) 转 换 为 double 类 型 。 
double dc; 
cin >> dc; 
double df = 9.0/5*dc+32;  //better 


4.4 ”语句 


4.3 节 介 绍 了 利用 各 种 运算 符 组 成 表达 式 来 进行 相应 的 数值 计算 。 如 果 要 同时 计算 多 个 数 
值 , 应 该 怎么 办 ? 如 果 要 重复 计算 多 次 呢 ? 如 果 要 在 多 个 可 选项 中 进行 选择 应 如 何 做 ? 应 该 如 何 
获得 输入 、 输 出 数据 ?和 许多 语言 一 样 , C++ 语言 也 是 通过 语句 来 实现 这 些 功能 的 。 

到 目前 为 止 , 我 们 已 经 见 过 两 种 语句 了 : 表达 式 语句 和 声明 语句 。 表 达 式 语句 是 以 分 号 结束 
的 一 个 表达 式 。 例 如 : 


a=b; 
++b; 


上 面 是 两 个 表达 式 语句 的 例子 。 注 意 ，= 是 运算 符 。 因 此 , a =b; 是 一 个 以 分 号 结尾 的 表达 式 语 
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句 。 分 号 的 使 用 主要 是 出 于 技术 上 的 考虑 , 例如 : 


a=b++b; /syntax error: missing semicolon 
这 条 语句 错误 的 原因 是 : 如 果 缺 少 分 号 的 话 ， 编译 器 不 知道 这 条 语句 表示 的 是 a=b++; b; 或 者 
a=b; ++b;。 这 种 二 义 性 问题 不 但 存在 于 编程 语言 中 , 也 存在 于 自然 语言 中 。 例 如 ,“ 人 了 吃 虎 ” 
( man eating tiger) 这 人 句 话 就 很 令 人 费解 , 到底 谁 吃 谁 啊 ? 如 果 加 上 标点 符号 就 很 好 理解 了 :“ 食 人 
虎 ”( man-eating tiger) 。 


计算 机 是 严格 按照 语句 在 程序 中 的 书写 顺序 来 执行 的 , 例如 ; 
inta= 7; 
Cout << a<< ANn'; 


在 这 里 , 变量 声明 语句 及 其 初始 化 在 输出 语句 之 前 执行 。 
程序 中 的 语句 一 般 都 要 起 作用 , 我 们 把 不 起 作用 的 语句 称 为 无 效 训 句 。 例如 ， 


1+2; /do an addition, but don't use the sum 
a*b; /doamultiplication, but don’t use the product 


这 类 无 效 语 句 一 般 都 是 逻辑 错误 造成 的 ,编译 器 会 对 这 类 无 效 语句 给 出 警告 信息 。 总 结 一 下 , 表 
达 式 语句 主要 包括 赋值 语句 、O 语句 和 涌 数 调用 。 

此 外 , 我 们 还 介绍 一 种 其 他 语句 形式 :“ 空 语句 ”。 考 虑 如 下 代码 : 

(ym 
上 面 的 语句 看 上 去 是 有 错误 的 。 事 实 上 , 按照 程序 的 原意 , 它 也 确实 存在 语义 错误 : 第 一 行 不 应 
该 出 现 分 号 结束 符 。 但 不 幸 的 是 , 按照 C++ 语言 的 语法 , 这 是 一 个 合法 的 空 语句 , 分 号 前 什么 也 
没有 即 表 示 空 语句 , 它 什么 也 不 做 , 很 少 被 使 用 。 但 是 在 上 面 这 个 例子 中 , 空 语 句 的 存在 掩盖 了 

一 个 语义 错误 ， 而 且 编译 器 也 无 法 发 现 这 个 错误 , 这 样 就 大 大 增加 了 程序 员 发 现 错误 的 难度 。 

上 述 代码 的 执行 结果 是 什么 呢 ? 编译 器 首先 会 检查 x 的 值 是 否 等 于 5。 如 果 条 件 是 真 , 那么 
将 执行 接 下 来 的 语句 ( 空 语 句 ), 结果 是 什么 也 不 做 。 然 后 程序 执行 下 一 行 , y 被 赋值 为 3( 而 按照 
程序 的 原意 , 只 有 当 x 的 值 等 于 5 的 时 候 , 才 执 行 赋值 操作 ) 。 也 就 是 说 , 这 个 让 语句 没有 起 作用 : 
无 论 让 语句 的 结果 是 什么 , y 都 被 赋值 为 3。 这 是 一 个 新 手 常 犯 的 错误 ， 而 且 这 种 错误 很 难 发 现 。 
4. 4. 1 选择 语句 

无 论 在 程序 中 或 者 在 生活 中 , 我 们 都 会 面临 各 种 选择 问题 。 在 C++ 语言 中 , 选择 是 利用 过 语 
名 或 者 switch 语句 实现 的 。 

4.4.1.1 这 语句 

让 语句 是 最 简单 的 选择 语句 ， 可 以 在 两 种 可 选 分 支 中 进行 选择 。 例 如 ， 


int main() 


inta = 0; 

int b = 0; 

cout << "Please enter two integers\n"; 
cin >> a >> b; 


if(a<b) /condition 
// 1st alternative (taken if condition is true): 
cout << "max(" <<a<<"," <<b <<") is" <<b <<'INnn; 


else | | , 
// 2nd alternative (taken if condition is false): 
cout << "max( <<a<<"," <<b <<") iis <<a<< Nn’; 
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站 语句 在 两 个 分 支 之 间 进 行 选择 , 如 果 条 件 为 真 , 那么 执行 第 一 个 分 支 语 句 , 否则 执行 第 二 个 分 支 语 

名 。 大 部 分 编程 语言 都 是 这 样 规定 的 。 事 实 上 , 编程 语言 的 这 种 规定 来 自 于 实际 学 习 和 生活 中 的 习 

惯 。 例 如 , 在 幼儿 园 你 就 应 该 学 习 了 过 马路 时 要 看 交通 灯 :“ 红 灯 停 , 绿灯 行 ”对 应 的 C++ 程序 为 : 
if (traffic_light==green) go(); 


和 
if traffic_light==red) wait(); 


虽然 ff 语句 的 基本 概念 很 简单 , 但 在 使 用 站 语句 时 也 要 仔细 。 看 看 下 面 的 程序 有 什么 错误 人 为 了 
简化 , 省 略 了 include 语句 ) : 


W convert from inches to centimeters or centimeters to inches 
ha suffix 'i' or 'c' indicates the unit of the input 

int main() 

{ 

const double cm_per_inch = 2.54; / number of centimeters in an inch 
double length = 1; // length in inches or centimeters 
char unit = 0; 

cout<< "Please enter a length followed by a unit KE or j):n"; 

cin >> length >> unit; 


if (unit == 'i") 

cout << length << "in == " << cm_per_ inch*length << "cmn',; 
else 

cout << length << "cm == " << length/cm_per_inch << "inn"; 


} 
实际 上 , 如 有 果 严 格 按照 格式 输入 数据 的 话 , 这 个 程序 是 能 够 正确 执行 的 : 输入 1i 得 到 输出 lin = 
2. 54cm; 输入 2.54c 得 到 输出 2. 54cm == lin。 读 者 不 妨 自己 试 一 下 。 

这 个 程序 的 问题 在 于 我 们 没有 测试 非法 数据 输入 的 情况 , 它 假定 每 一 次 输入 都 是 合法 的 。 程 
序 的 条 件 unit =='i' 只 是 区 分 了 'i' 和 其 他 的 所 有 情况 , 而 没有 专门 针对 'c ' 进 行 判 断 。 

如 果 用 户 输入 15f(15 英尺 ) 会 出 现 什么 情况 呢 ? 条 件 表达 式 (unit =='i' ) 的 值 为 假 。 因 此 , 程 
序 将 执行 else 部 分 (第 二 个 分 支 ) ， 即 执行 厘米 到 英寸 的 转换 。 但 是 ,这 个 结果 明显 不 是 我 们 需要 
的 英尺 的 转换 。 

除了 合法 输入 情况 以 外 , 程序 必须 要 经 过 各 种 非法 输入 的 检验 。 因 为 对 用 户 来 说 , 非法 输入 
是 不 可 避免 的 。 这 些 非法 输入 可 能 是 偶然 的 , 也 可 能 是 故意 的 。 但 不 管用 户 出 于 什么 目的 造成 了 
非法 输入 的 情况 , 程序 都 必须 能 够 检测 到 。 z 

下 面 给 出 了 上 述 代码 的 改进 版 本 : 


// convert from inches to centimeters or centimeters to inches 
/a suffix 'i' or 'c' indicates the unit of the input 
// any other suffix is an error 


int main() 

{ 
const double cm_per_inch = 2.54; //number of centimeters in an inch 
double length = 1; // length in inches or centimeters 
char unit="'; /a space is not a unit 


cout<< "Please enter a length followed by a unit (c or i):\n'; 
cin >> length >> unit; 


if (unit == i") 

cout << length << "in == " << cm_per_inch*length << "cmn"; 
else if (unit == 'c) 

cout << length << "cm == " << length/cm_per_inch << "inn"; 
else 

cout << "Sorry, | don't know a unit called " << unit <<"\n"; 
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在 这 个 程序 中 , 依次 检验 unit =='i' 和 unit =='c'， 如果 都 不 成 立 , 则 显示 出 错 信 息 。 看 上 去 好 像 
是 我 们 使 用 了 else-f 语 句 , 但 C++ 语言 中 没有 这 种 语句 。 实 际 上 , 这 里 是 将 两 条 让 语句 组 合 起 来 
使 用 的 。 让 语句 的 一 般 形式 为 ， 

让 (表达 式 ) 语句 else 语句 
关键 字 半 后 面 是 用 括号 括 起 来 的 表达 式 ， 然 后 是 一 条 语句 ，else 后 面 是 另 一 个 分 支 语句 ， 其 中 该 
分 文 语 名 可 以 是 一 条 证 语句 : 

if (表达 式 ) 语句 else (表达 式 ) 语句 else 语种 
上 面 所 给 程序 的 结构 如 下 : 

if (unit == "i') | 

有 / 1st alternative 

else if (unit == 'c') 

/ 2nd alternative 


else 
// 3rd alternative 


通过 这 种 方式 , 我 们 可 以 写 出 包含 任意 分 文 的 复杂 语句。 但 需要 注意 的 是 , 代码 应 该 尽量 简洁 ， 
而 不 是 复杂 。 编 写 最 复杂 的 代码 并 不 能 显示 你 的 智力 水 平 。 反 之 , 能 够 用 简洁 的 代码 完成 同样 的 
目标 才能 体现 你 的 能 力 。 
试 一 试 ”基于 前 面 给 出 的 示例 程序 ,编写 一 个 能 够 将 日 元 、 欧 元 和 英镑 兑换 为 美元 
的 程序 。 为 了 更 接近 实际 情况 , 你 可 以 从 互联 网 上 获得 最 新 的 汇率 。 
4. 4. 1. 2 ”switch 语句 
实际 上 , 示例 中 的 unit 和 'i"、'c' 的 比较 是 最 和 常见 的 选择 形式 : 基于 数值 与 多 个 常量 比较 的 选 
择 。 在 程序 设计 中 经 常会 用 到 这 种 选择 , 因此 C++ 语言 专门 提供 了 一 个 语句 : switch 语句 。 利 用 
switch 语句 可 将 前 面 的 程序 改写 为 : 
int main() 
{ 
const double cm_per_inch = 2.54; / number of centimeters in an inch 
double jength = 1; // length in inches or centimeters 
char unit = 'a 
cout<< "Please entera length followed by a unit (c or j):\n"; 
cin >> length >> unit; 
switch (unit) { 
case i': 
cout << length << "in == " << cm_per_inch*length << "cm\n"; 
break; 
Case 'c': 
cout << iength << "cm == " << length/cm._per_inch << "in\n"; 
break; 
defauit: 
cout << "Sorry | don’t know a unit called << unit << "An"); 
break; 


} 
} 


与 和 语句 相 比 ，switch 语句 更 加 清晰 易 懂 , 特别 是 与 多 个 常量 进行 比较 时 。 关 键 字 switch 后 括号 
中 的 值 与 一 组 常量 进行 比较 , 每 个 常量 用 一 个 case 语句 标记 。 如 果 该 值 与 某 一 常量 相等 , 将 选择 
执行 该 case 语句 ,每 个 case 语句 都 以 break 结束 。 如 果 该 值 与 任何 一 个 case 后 的 常量 都 不 相等 ， 
则 选择 执行 default 语句 。 虽 然 default 语句 不 是 必须 的 , 但 我 们 建议 你 加 上 , 除非 你 能 够 完全 确定 
给 出 的 分 支 已 经 覆盖 了 所 有 的 情况 。 注 意 , 编程 能 够 让 你 理解 世界 上 没有 绝对 确定 的 事情 。 
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4. 4. 1. 3 switch 技术 

下 面 是 一 些 与 switch 语句 相关 的 技术 细节 : 

1 ) switch 语句 括号 中 的 值 必 须 是 整 型 、 字 符 型 或 枚 举 类 型 (参见 9.5 节 ) 。 特 别 地 , 不 能 使 用 
字符 串 类 型 。 

2) case 语句 中 的 值 必须 是 常量 表达 式 ( 参 见 4.3. 1 节 )，, 不 能 使 用 变量 。 

3) 不 能 在 两 个 case 语句 中 使 用 相同 的 数值 。 

4) 允许 多 个 case 语句 使 用 相同 的 复合 语句 。 

5 ) 不 要 忘记 在 每 个 case 语句 末尾 加 上 break。 注 意 , 编译 需 不 会 给 出 未 加 break 的 任何 警告 信息 。 

例如 : 


int main()  //you can switch only on integers, etc. 
{ 
cout << "Do you like fish?\n"; 
string s; 
cin >> s; 
Switch (s){  //error: the value must be of integer, char, or enum type 
Case "no": 
Ms 
break; 
case "yes”: 
hi... 
break; 
} 
} 


如 果 要 对 string 类 型 的 数据 进行 选择 , 只 能 使 用 过 语句 或 者 map( 见 第 21 章 )。 
switch 语句 能 够 对 一 组 常量 的 比较 产生 优化 的 代码 , 特别 是 当 常 量 数 目 很 多 的 时 候 , switch 语 
句 比 放 语句 的 挫 套 使 用 更 加 有 效 。 但 是 ，case 语句 中 的 值 必 须 是 常量 , 而 且 不 能 重复 。 例 如 : 


int main() / case labels must be constants 
{ 
/ define alternatives: 
inty= Y; // this is going to cause trouble 
const char n = 'n'; | 
const char m = '?"; 
cout << "Do you like fish?\n"; 


char a; 
cin >> a; 
switch (a) { 
Case n: 
Ma 
break; 
case y: // error: variable in case label 
/ke 
break; 
case m: 
1 
break; 
case 'n': // error: duplicate case jabel (ns value is 'n') 
Wess 
break; 
default: 
Mss 
break; 
} 
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如 果 希 望 采用 同样 的 操作 对 一 组 值 进行 处 理 , 可 以 为 这 个 操作 加 上 一 组 标 福 | 而 不 是 重 受 写 同 样 
的 操作 代码 。 例 如 : 
int main() // you can label a statement with several case labels 
{ 
cout << "Please enter a digitn"; 
char a; 
cin >> a; 


switch (a) { 

case '0': case '2': Case '4': case '6': case '8': 
cout << "is even\n"; 
break; 

case '1': case '3': Case '5'; Case '7': case '9': 
cout << "is 0dd\n"; 
break; 

default: 
cout << "is not a digitin"; 
break; 

} 

} 


使 用 switeh 语句 时 , 常 犯错 误 是 忘记 为 case 语句 添加 break。 例 如 : 


int main() //example of bad code (a break is missing) 


{ 
const double cm_per_inch = 2.54; //number of centimeters in an inch 
double length = 1; /I length in inches or centimeters 
char unit = 'a'; | 
cout << "Please enter a length followed by a unit (cor i):\n"; 
cin >> length >> unit; 
switch (unit) { 
Case 个: 
cout << length << "in == "<< cm_per_inch*length << "cm\n"; 
Case 'C': 
cout << length << "cm == " << length/cm_per_inch << "inn"; 
} 


不 幸 的 是 ,对 于 上 面 这 个 例子 ,编译 器 是 不 会 报错 的 。 当 执行 完 case 'i' 的 代码 后 , 程序 接着 执行 
case'c 的 代码 。 如 果 输 入 2i 的 话 , 程序 将 输出 


2in == 5.08cm 
2cm == 0.787402in 


这 个 问题 需要 特别 注意 ! 
试 一 试 ”用 switch 语句 重 写 4.4.1.1 节 的 “ 试 一 试 " 中 给 出 的 汇率 转换 程序 ,并 且 增 

加 人 民 币 和 克朗 的 转换 功能 。 哪 一 个 版 本 的 程序 更 容易 编写 、 理 解 和 修改 呢 ? 为 什么 ? 
4. 4. 2 ”循环 语句 

现实 生活 中 , 我 们 经 常会 遇 到 一 些 重复 性 的 工作 。 为 此 , 编程 语言 也 提供 了 相应 的 语言 工 
具 , 称 为 循环 (repetition) 。 在 对 一 系列 数据 进行 同样 处 理 的 时 候 , 也 称 它 为 选 代 (iteration ) 。 

4.4.2.1 While 语句 

在 世界 上 第 一 台 能 存储 程序 的 计算 机 (名 为 EDSAC) 上 运行 的 第 一 个 程序 就 是 一 个 循环 语句 
程序 , 它 是 由 英国 剑桥 大 学 计算 机 实验 室 的 David Wheeler 在 1949 年 5 月 6 日 编写 的 , 其 目的 是 计 
算 并 打印 下 面 这 个 简单 的 平方 表 : 


一 
mm 


9801 


平方 表 的 每 一 行 是 一 个 数 , 后 面 跟着 一 个 制 表 符 ( \t' ) ， 然 后 是 该 数 的 平方 。 该 程序 的 C++ 
版 本 如 下 : 


// calculate and print a table of squares 0-99 
int main() 
{ 
int i = 0; lf start from 0 
while (i<100) { 
cout << i << At << square(i) << \n’; 
++i; /increment i (that is, i becomes i+]1) 
} 
} 


程序 中 的 square(i) 表示 i 的 平方 , 其 含义 和 用 法 将 在 后 续 章 节 中 解释 (参见 4.5 节 )。 
实际 上 , 这 个 程序 并 不 是 一 个 真正 的 C++ 程 序 。 它 的 程序 逻辑 如 下 : 
e 从 0 开始 计数 。 
e。 检查 计数 是 否 达到 100, 如 果 是 的 话 , 程序 结束 。 
。 否则 , 打印 这 个 数 和 它 的 平方 , 中 间 用 制 表 符 (\t') 隔 开 。 计 数 加 1, 重复 上 述 操作 。 
.显然 , 完成 上 述 目 标 , 我 们 需要 
。 一 种 实现 语句 重复 执行 的 方法 (循环 )。 
一 个 记录 循环 次 数 的 变量 (循环 变量 或 控制 变量 ) ， CO i。 
。 循环 变量 的 初始 化 , 在 示例 中 是 0。 
e 循环 结束 条 件 , 在 示例 中 是 循环 100 次 。 
。 每 次 循环 中 完成 的 操作 ( 循环 体 ) 。 
这 里 使 用 while 语句 实现 这 个 功能 。 在 while 语句 中 , 关键 字 while 之 后 是 循环 条 件 , 然后 是 循环 体 。 


while (i<100) /the loop condition testing the loop variable i 
{ 

cout <<i << At << square(i) << \n'; 

++i; // increment the joop variable i 


} 
循环 体 是 一 个 程序 块 , 其 任务 是 输出 平方 表 的 一 行 , 并 将 循环 控制 变量 i 的 值 加 1。 每 次 循环 开始 
都 要 检查 循环 条 件 i < 100 是 否 成 立 , 若 成 立 则 执行 循环 体 ; 如 果 不 成 立 , 即 i 的 值 达到 100 的 时 
候 , 则 结束 while 语句 ,执行 后 续 的 程序 代码 。 在 上 面 的 示例 中 ，while 语句 是 程序 的 最 后 一 条 语 
句 。 因 此 ，while 语句 结束 后 程序 也 随 之 结束 。 

while 语句 的 循环 控制 变量 必须 在 while 语句 之 前 定义 和 初始 化 , 否则 编译 器 将 返回 一 个 错 
误 。 如 果 定 义 了 循环 控制 变量 而 没有 初始 化 , 大 部 分 编译 器 会 返回 一 个 警告 信息 “本 地 变量 i 没 
有 赋 初 值 ”， 但 不 会 作为 编译 错误 来 处 理 。 请 注意 , 编译 器 给 出 的 变量 未 初始 化 的 信息 大 都 是 对 
的 , 未 初始 化 的 变量 会 导致 很 多 错误 。 在 上 面 的 示例 中 , 应 该 加 上 下 面 的 语句 。 


int i = 0; /i start from 0 
编写 循环 语句 很 简单 , 但 让 循环 语句 能 够 准确 反映 实际 问题 却 很 困难 。 其 中 , 主要 难点 是 如 
何 让 循环 正确 地 开始 和 结束 , 这 里 的 关键 是 循环 条 件 的 设置 和 所 有 变量 的 初始 化 。 
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试 一 试 ”字符 b' 可 以 通过 char('a' +1) 得 到 , 字 律 c' 可 以 通过 char('a' +2) 得 到 。 
用 一 个 循环 语句 来 实现 字母 表 及 其 相应 ASCII 码 值 的 输出 : 


a 97 
b 98 
Z 122 


4. 4.2.2 ”程序 块 
注意 下 面 程序 中 while 语句 的 循环 体 是 如 何 定 义 的 : 


while (i<100) { 
cout <<i << At << square(i) << \n'; 
++i; /increment i (that is, i becomes i+1) 


} 
我 们 把 用 {和 | 括 起 来 的 语句 序列 称 为 程序 块 (block) 或 复合 语句 (compound statement) 。 程 序 块 是 


一 种 特殊 语句 , 不 包括 任何 具体 语句 的 程序 块 也 是 有 用 的 , 它 表 示 什 么 也 不 做 。 例 如 : 
if (a<=b) { /do nothing 


else { /swapaandb 
intt= a; 
a=b; 
bs=t; 

} 


4. 4. 2. 3 for 语句 

像 大 多 数 编程 语言 一 样 ,， C++ 为 针对 一 组 数据 的 迭代 操作 设置 了 专门 的 语句 。for 语句 与 
while 语句 类 似 , 只 是 for 语句 要 求 将 循环 控制 变量 集中 放 在 开头 ,以 便于 阅读 和 理解 。 使 用 for 语 
句 的 第 一 个 示例 如 下 : 

// calculate and print a table of squares 0-99 

int main() 

{ 

for (inti = 0; i<100; ++i) 
cout << i << At << squareli) << \n'; 


} 
该 程序 的 含义 是 “从 i 等 于 0 开始 执行 循环 体 , 每 执行 一 次 循环 体 , i 的 值 加 1, 直到 100 为 止 ”。 
for 语句 可 以 用 等 价 的 while 语句 来 替换 ,例如 : 


for (int i = 0; i<100; ++i) 
cout <<i << Nt << square() << \n'; 


等 价 于 
{ 四 
int i = 0; // the for-statement initializer 
while (i<100) { // the for-statement condition 
cout <<i<<'\'<< Square() <<"\n'; /theforstatementbody 
++i; / the for-statement increment 
) 
} 


有 的 初学 者 喜欢 使 用 while 语句 ,， 有 的 则 喜欢 使 用 for 语句 。 与 while 语句 相 比 , for 语句 的 代码 更 
容易 理解 和 维护 。 这 是 因为 for 语句 将 循环 相关 的 初始 化 、 循 环 条 件 和 增 量 操作 集中 放 在 一 起 ， 
而 while 语句 则 不 是 这 样 。 

注意 , 不 要 在 for 语句 的 循环 体内 修改 循环 控制 变量 的 值 。 这 种 操作 虽然 没有 语法 错误 , 但 
是 它 违背 了 读者 对 于 循环 的 普遍 理解 和 认识 。 考 虑 下 面 这 个 例子 : 
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int main() 
{ 
for (inti = 0; i<100; ++){ /foriinthe [0:100) range 
cout << i << Nt << Square(i) << nn' 
+ti; /whats going on here? lt smells like an error! 
} 
} 


乍 看 起 来 , 每 个 人 都 认为 上 面 的 循环 会 执行 100 次 , 但 实际 上 不 到 100 次 。 循 环 体 中 的 ++i 
语句 使 得 i 的 值 每 执行 一 次 循环 体 就 加 2, 所 以 只 执行 了 50 次 。 这 个 程序 虽然 没有 语法 错误 , 但 
是 我 们 看 到 这 样 的 程序 仍然 认为 程序 有 错 , 错误 原因 也 许 就 是 把 while 语句 转换 为 for 语句 时 的 粗 
心 大 意 造 成 的 。 如 果 我 们 希望 循环 控制 变量 每 次 加 2, 可 以 像 下 面 这 么 写 : 

// calculate and print a table of squares of even numbers in the [0:100) range 


int main() 


for (inti = 0; i<100; i+=2) 
cout <<i << Nt << square(l) << An ; 


) 
此 外 , 还 需要 注意 程序 的 简洁 性 , 后 面 将 介绍 一 些 典 型 的 示例 。 

试 一 试 使 用 for 语 句 重 写 4.4.2.1 节 的 字符 输出 程序 , 并 修改 你 的 程序 , 使 其 还 可 
以 输出 所 有 大 写字 母 和 数字 。 


4.5 项 数 


在 上 面 的 程序 中 square(i) 是 什么 呢 ? 它 是 一 个 函数 调用 。 准 确 地 说 , 它 使 用 参数 i 调用 
square 函数 。 台 数 (function) 是 一 个 命名 的 语句 序列 ， 能 够 返回 计算 结果 ( 称 为 返回 值 ) 。C++ 的 
标准 库 提 供 了 许多 有 用 的 函数 ,例如 在 3. 4 节 中 用 到 的 求 平方 根 函 数 sqrt( ), 但 我 们 在 程序 中 还 
需要 写 很 多 函数 。square 函数 的 一 种 可 行 定义 如 下 : 

int square(int x) /return the square of x 

return x*x; 
” } 
第 一 行 说 明 这 是 一 个 名 为 square 的 函数 (由 括号 可 知 ) ， 它 有 一 个 int 型 参数 (名 为 x), 返回 值 也 
是 int 型 (函数 定义 中 的 第 一 个 关键 字 ) 。 这 个 函数 的 使 用 如 下 : 


int main() 
{ 
cout << square(2) << "\n'’; /print 4 
cout << square(10) << Am" // print 100 
} 


对 于 函数 的 返回 结果 , 我 们 可 以 使 用 也 可 以 不 使 用 。( 但 如 果 我 们 不 需要 函数 返回 结果 的 话 , 为 
什么 还 要 调用 它 呢 ?) 但 是 , 我 们 必须 严格 按照 函数 的 定义 给 它 传递 参数 , 例如: 


square(2); // probably a mistake: unused return value 
int v1 = square(); // error argument missing 
int v2 = Square; // error: parentheses missing 


int v3 = square(1,2); // error: too many arguments 
int v4 = square("two");  //error: wrong type of argument 一 int expected 


很 多 编译 器 都 会 警告 未 使 用 的 函数 返回 值 , 并 给 出 上 面 示例 中 的 错误 信息 。 你 可 能 会 认为 计算 机 
很 “聪明 ”, 它 应 该 能 够 理解 “two” 表示 整数 2。 但 实际 上 ，C ++ 编译 器 并 不 像 你 想象 的 那样 。 编 
译 器 的 工作 是 检查 你 的 代码 是 否 符合 C++ 语言 规范 , 并 严格 按照 你 的 程序 要 求 去 执行 。 如 果 让 
编译 器 去 猜测 你 的 真实 意图 的 话 , 那么 它 很 可 能 会 猜 错 ， 从 而 导致 你 或 者 你 的 程序 用 户 陷 入 麻 
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烦 。 你 将 会 发 现 如 果 没 有 编译 器 的 猜测 等 “帮助 ”, 很 难 预测 程序 的 运行 结果 。 
函数 体 (function body ) 是 实现 某 种 具体 功能 的 程序 块 (参见 4.4.2.2 节 )。 
{ 


return x*x; /return the square of x 


} 
函数 square 的 实现 比较 简单 : 计算 参数 的 平方 , 并 将 计算 结 采 作为 沙 数 返回 值 。 显 然 , 用 C++ 语 
言 描述 比 用 自然 语言 (英语 、 汉语 等 ) 描 述 更 简洁 。 这 一 点 在 很 多 情况 下 都 适用 ， 毕竟, 程序 语言 
的 目的 就 是 用 一 种 更 简洁 、 准 确 的 方式 来 描述 我 们 的 思想 。 

函数 定义 (function definition ) 的 语法 描述 如 下 : 

类 型 函数 名 (参数 表 ) 函数 体 
其 中 , 类 型 是 函数 的 返回 值 类 型 ， 函数 名 是 函数 的 标记 , 括号 内 是 参数 表 ， 函 数 体 是 实现 冰 数 功 
能 的 语句 。 套 数 表 (parameter list) 的 每 一 个 元 素 称 为 一 个 参数 ( parameter) 或 形式 参数 (formal argu- 
ment) ， 人 参数 表 可 以 为 空 。 如 果 不 需 要 函数 返回 任何 结果 , 返回 值 类 型 可 以 设置 为 void。 例 如 : 

人 write_sorry(} Vitake no argument; return no value 


cout << "Sorryn'"; 
} 


函数 语法 的 相关 细节 可 以 参考 本 书 第 8 章 的 内 容 。 
4. 5. 1 使 用 函数 的 原因 

当 需 要 将 一 部 分 计算 任务 独立 实现 的 时 候 , 可 以 将 其 定义 为 一 个 函数 ,因为 这 样 可 以 : 

。 实现 计算 逻辑 的 分 离 。 

。 使 代码 更 清晰 (通过 使 用 函数 名 ) 。 

。 利 用 函数 , 使 得 同样 的 代码 在 程序 中 可 以 多 次 使 用 。 

。 减少 程序 调试 的 工作 量 。 
在 本 书 的 后 续 内 容 中 , 我 们 将 看 到 很 多 解释 上 述 原因 的 示例 , 并 且 我 们 还 会 再 次 谈 及 某 个 原因 。 
注意 , 实际 的 应 用 程序 可 能 会 用 到 成 百 上 千 个 函数 , 某 些 程序 甚至 会 用 到 上 百 万 个 函数 。 显 然 ， 
如 果 这 些 函数 不 能 被 清楚 地 划分 和 命名 的 话 , 任何 人 都 不 可 能 编写 和 理解 这 种 包含 大 量 函 数 的 程 
序 。 而 且 , 你 会 发 现 很 多 函数 被 重复 使 用 , 很 快 这 将 导致 你 厌倦 于 这 种 重复 性 的 劳动 。 例 如 , 纺 
写 处 理 x*x、7*7 和 (x+7) * (x+7) 等 的 程序 可 能 会 令 你 高 兴 。 但 是 , 对 完成 同样 功能 的 函数 
square(x) 、square(7) 和 square(x +7) 却 可 能 会 让 你 厌倦 。 这 是 因为 , 求 平方 是 非常 容易 实现 的 ， 
但 对 于 复杂 函数 来 说 , 情况 大 不 相同 : 对 于 求 平方 根 函 数 (C++ 中 的 sqrt) 来 说 , 程序 员 更 喜欢 使 
用 sqrt(x) 、sqrt(7) 和 sqrt(x +7) ， 而 不 是 每 一 次 都 重复 实现 相同 的 求 平方 根 的 代码 (这 些 代码 很 
长 、 很 复杂 ) 。 实 际 上 , 大 多 数 情况 下 , 你 根本 不 需要 了 解 求解 平方 根 函 数 的 实现 细节 ， 而 只 需要 
知道 sqrt(x) 将 返回 x 的 平方 根 就 可 以 了 。 

在 8.5 节 中 , 我 们 将 详细 介绍 相关 的 函数 编写 技巧 。 下 面 我 们 将 给 出 另外 一 个 示例 。 

如 果 我 们 想 让 主 函 数 中 的 循环 更 简洁 , 可 将 程序 改写 为 : 


void print_square(int v) 
{ 
cout <<v << Nt << Vv << nN'; 


} 


int main() 
{ 
for (int i = 0; i<100; ++i) print_square(i); 


} 
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但 我 们 为 什么 不 用 print_square( ) 版 本 的 程序 呢 ? 因为 这 个 版 本 的 程序 实际 上 并 不 比 square( ) 版 
本 的 程序 更 简洁 。 因 为 : 

。 print_square( ) 是 一 个 比较 特殊 的 函数 ， 以 后 很 难 再 次 用 到 它 , 而 square( ) 可 以 多 次 重复 

使 用 。 
。 square( ) 几乎 不 需要 任何 额外 的 说 明文 档 ， 而 print_square( ) 需 要 相关 文档 说 明 果 数 的 功 
能 和 使 用 方法 等 。 

根本 的 原因 是 print_square( ) 需要 执行 两 个 独立 的 逻辑 操作 : 

。 输出 结果 。 

。 计算 平方 值 。 
如 有 果 每 个 晴 数 只 完成 单一 的 逻辑 操作 ,那么 程序 将 更 易于 编写 和 理解 。 因 此 , 使 用 square( ) 是 一 
个 更 好 的 选择 。 

最 后 , 为 什么 我 们 要 用 square( ) 而 不 是 第 一 个 版 本 程序 中 的 i*i 昵 ? 使 用 函数 的 目的 之 一 是 
用 函数 把 一 些 复杂 的 运算 分 离 出 来 。 对 程序 的 1949 年 版 本 来 说 , 硬件 没有 提供 对 乘法 操作 的 直 
接 支 持 ,， 因此, 1949 年 版 本 程序 中 的 乘法 是 一 个 类 似 笔 算 的 复杂 计算 过 程 。 而 且 , 1949 年 版 本 程 
序 的 作者 (David Wheeler) 也 是 现代 计算 中 的 函数 ( 称 为 子 程序 ) 的 发 明 者 , 这 也 是 使 用 square( ) 的 
原因 。 

试 一 试 ”不 用 乘法 操作 实现 square( ) 的 功能 ， 即 利用 重复 加 法 操作 实现 x*x( 设 置 

一 个 初 值 为 0 的 变量 , 把 xX 的 值 加 到 该 变量 上 x 次 )。 然 后 , 利用 这 一 square( ) 运 行 前 面 

的 示例 。 
4.5.2 销 数 再 朋 

你 是 否 注 意 到 ,也 数 调用 所 需 的 所 有 信息 都 已 经 包括 在 函数 定义 的 第 一 行 ? 例如 : 

int square(int x) 
根据 这 些 信 息 , 可 以 写 出 如 下 语句 : 

int x = square(44); 
我 们 不 需要 知道 函数 体 是 如 何 实现 的 。 在 编写 程序 的 时 候 , 我 们 一 般 不 需要 知道 函数 体 的 实现 细 
节 。 为 什么 我 们 要 知道 标准 库 盟 数 sqrt( ) 是 如 何 实现 的 呢 ? 我 们 知道 它 能 够 计算 参数 的 平方 根 。 
为 什么 我 们 要 阅读 square( ) 郴 数 的 代码 呢 ? 虽然 我 们 可 能 会 好 奇 它 的 具体 实现 , 但 大 多 数 情况 
下 , 我 们 仅仅 关心 如 何 调 用 孙 数 就 可 以 了 。 幸 运 的 是 , C++ 提供 了 一 种 与 函数 定义 分 离 的 方法 来 
显示 了 因数 的 信息 ,， 称 为 函数 声明 (function declaration ) 。 


int square(int); // declaration of square 
double sqrt(double);  // declaration of sqrt 


注意 , 函数 声明 以 分 号 结束 , 分 号 替代 了 函数 定义 中 的 函数 体 部 分 : 
int square(int x)  // definition of square 
{ 
return XxX; 


} 
如 果 你 想 使 用 某 个 函数 , 可 以 在 代码 中 声明 或 者 通过 #include 包含 该 函数 的 函数 声明 ， 而 函数 的 
定义 可 以 在 程序 的 其 他 部 分 , 我 们 将 在 8.3 节 和 8.7 节 中 讨论 具体 的 实现 细节 。 函 数 声 明和 函数 
定义 的 分 离 对 于 大 型 程序 是 非常 必要 的 , 我 们 可 以 用 函数 声明 来 保证 代码 的 简洁 ,从 而 保证 在 同 
一 时 刻 将 注意 力 集中 在 程序 的 某 一 局 部 区 域 上 (参见 4.2 节 )。 
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4.6 回 量 


在 编写 程序 之 前 , 我 们 首先 要 准备 好 相关 的 数据 。 例 如 , 我 们 可 能 需要 准备 一 组 电话 号 码 ， 
一 个 球 队 的 队员 名 单 , 一 个 课程 表 , 最 近 一 年 读 的 书 的 列表 ,下载 歌 曲 的 分 类 表 , 汽车 付款 的 可 
选 途径 , 下 周 每 一 天 的 天 气 预 测 情况 , 同一 款 相 机 在 不 同 网 上 商店 的 价格 对 比 表 等 。 程 序 可 能 用 
到 的 各 种 数据 形式 数不胜数 , 并 存储 在 于 程序 的 所 有 代码 中 。 我 们 将 从 数据 的 各 种 存储 形式 开始 介 
绍 ( 其 他 数据 存储 形式 介绍 参考 本 书 第 20 章 和 第 21 章 )。 最 简单 、 最 常用 的 数据 存储 形式 是 向 量 。 

向 量 是 一 组 可 以 通过 索引 来 访问 的 顺序 存储 的 数据 。 size 
元 素 。 例 如 , 右 图 是 一 个 名 为 v 的 向 量 。 其 中 , 第 一 个 数 “EE 和 i wa va va ws 
据 元 系 的 索引 号 是 0, 第 二 个 是 1, 依 此 类 推 。 我 们 可 以 ”v 的 数据 元 素 症 517|9|4|16|s| 
用 回 量 名 和 索引 号 的 组 合 来 表示 一 个 具体 的 数据 元 素 , 例 
如 vL0] 是 5, v[1] 是 7, 依 此 类 推 。 向 量 的 索引 号 总 是 从 0 开始 , 每 次 加 1。 看 上 去 有 些 熟悉 , 实 
际 上 疝 量 是 C++ 标准 库 函 数 中 一 个 历史 久远 的 著名 库 函 数 实现 的 简化 版 本 。 图 中 特别 强调 了 向 
量 v“ 知道 目 己 的 大 小 ”", 即 回 量 不 仅 存 储 数据 元 素 , 也 存储 元 素 的 个 数 。 

向 量 可 以 用 如 下 形式 表示 : 

vector<int> v(6); vectorof 6 ints 

Vv[I0] = 5; 

vI1] = 7; 

Vv[I2] = 9; 

VI3] = 4; 


VvI4] = 6; 
vI5] = 8; 
可 以 看 出 , 定义 一 个 向 量 需 要 确定 向 量 的 数据 类 型 和 元 素 个 数 。 数 据 类 型 在 紧 跟 向 量 名 的 < > 内 
定义 (如 <int > )， 向 量 包含 的 元 素 个 数 在 后 面 的 圆 括号 内 定义 (如 (6) ) 。 下 面 是 另 一 个 示例 : 
Vector<string> philosopher(4); /vector of 4 strings 
philosopher [0] = "Kant"; 
philosopher [1] = "Plato"; 
philosopher [2] = "Hume"; 
philosopher [3] = "Kierkegaard"; 
显然 , 一 个 向 量 只 能 存储 与 其 数据 类 型 相同 的 数据 : 


philosopher[2] =99; /error: trying to assign an int to a string 







VvI2] = "Hume"; I/ error: trying to assign a string to an int 
当 一 个 给 定 大 小 的 向 量 被 定义 后 , 根据 数据 类 型 的 不 同 , 它 的 每 一 个 数据 元 素 将 被 赋予 不 同 的 初 
值 , 例如 : 

vector<int> v(6); I vector of 6 ints initialized to 0 


vector<string> philosopher(4); //vector of 4 strings initialized to ™ 


当然 , 也 可 以 为 向 量 赋予 你 希望 的 初 值 。 例 如 : 


vector<double> vd(1000,—1.2); vector of 1000 doubles initialized to -1.2 


注意 , 不 能 引用 一 个 不 存在 的 向 量 元 素 。 例 如 : 


vd[20000] = 4.7; I run-time error 
我 们 将 在 第 5 章 详细 讨论 关于 运行 错误 的 细节 。 
4.6.1 向 量 空间 增长 

我 们 使 用 回 量 的 时 候 , 一 般 是 从 一 个 空间 量 开始 , 根据 需要 逐步 填充 数据 。 这 里 的 关键 操作 
是 push_back( )， 它 将 一 个 新 元 素 添 加 到 向 量 中 , 该 元 素 成 为 向 量 的 最 后 一 个 元 素 。 例 如 : 
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vector<double>v;  // start off empty; that is, v has no elements 


“Le | 


v.push_back(2.7); /add an element with the value 2.7 at end (“the back’”) of v 
//v now has one element and v[0}==2.7 





v.push_back(5.6);  //add an element with the value 5.6 at end of v 
//v now has two elements and v[1]==5.6 





vpush_back(7.9); /add an element with the value 7.9 at end of v 
//v now has three elements and v[2]==7.9 





注意 push_back( ) 的 调用 方法 ， 这 是 一 个 记 员 贝 郴 数 调 用 ee function call ) 。push_back( ) 是 向 
量 的 一 个 成 员 函 数 , 因此 它 的 调用 必须 采用 符号 “.” 

对 象 名 . 成 员 水 数 名 (参数 表 ) 
向 量 的 大 小 可 以 通过 调用 成 员 函 数 size( ) 来 获得 。 初 始 时 v. size( ) 的 值 是 0, 三 次 调用 push_back( ) 
之 后 , v. size( ) 的 值 变 为 3。 在 遍历 向 量 元 素 的 时 候 , 向 量 的 大 小 可 以 作为 循环 控制 变量 。 例 如 : 


for(int i=0; ji<v.size(); ++i) 
cout << "Vv[" <<i << "J==" <<v[ << \n'; 


给 定 上 述 v 和 push_back( ) 的 定义 之 后 , for 循环 将 输出 : 
Vv[0]==2.7 
Vv[1]==5.6 
v[2]==7.9 


如 果 你 以 前 写 过 程序 , 你 会 注意 到 向 量 非常 类 似 于 C 语言 中 的 数组 。 但 在 向 量 中 , 你 不 需要 事先 
指定 向 量 的 大 小 , 而 且 你 可 以 往 向 量 中 添加 任意 多 个 元 素 。 后 面 还 将 发 现 C++ 语言 的 向 量 有 更 
多 有 价值 的 特性 。 
4. 6. 2 一 个 数值 计算 的 例子 

让 我 们 来 看 一 个 更 实际 的 例子 。 我 们 经 常会 遇 到 把 一 系列 数据 读 人 程序 来 处 理 的 情况 , 这些 
数据 处 理 操作 包括 : 根据 数据 显示 图 形 , 计算 平均 值 和 中 值 , 找 出 最 大 元 素 、 排 序 、 数 据 融 合 、 搜 
索 、 与 其 他 数据 的 比较 等 。 对 于 数据 的 处 理 操作 是 没有 任何 限制 的 , 但 在 做 各 种 数据 处 理 前 ， 必 
须 先 把 数据 读 入 内 存 中 。 下 面 是 一 种 把 未 知 大 小 (可 能 很 大 ) 的 数据 读 入 计算 机 的 基本 方法 。 不 
失 一 般 性 , 我 们 选择 读 入 表示 温度 的 一 系列 浮 点 数 : 


// read some temperatures into a vector 


int main() 

{ 
vector<double> temps; // temperatures 
double temp; 
while (cin>>temp) /read 


temps.push_back(temp); // put into vector 
/ ...dosomething ... 


} 
我 们 得 到 什么 了 呢 ? 首先 , 我 们 声明 了 一 个 用 于 存储 数据 的 向 量 , 然后 通过 一 个 临时 变量 将 数据 
输入 这 个 向 量 : 

vector<double> temps; / temperatures 


double temp; 
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这 两 条 语句 说 明了 我 们 希望 使 用 的 数据 类 型 ,此 处 为 double 类 型 。 
接 下 来 是 实际 的 读 循环 : 


while (cin>>temp) // read 
temps.push. back(temp); // put into vector 


语句 cin >> temp 读 和 一 个 double 类 型 的 数据 , 然后 将 这 个 数据 置信 向 量 中 ( 放 在 最 后 )。 这 里 用 
到 的 每 个 操作 在 前 面 的 示例 中 几乎 都 出 现 过 , 只 是 这 里 使 用 输入 语句 cin > > temp 作为 while 循环 
的 条 件 。 如 果 正 确 输入 数据 ，cin >> temp 返回 true, 否则 返回 false。 因 此 ,while 循环 将 读 人 我 们 
输入 的 所 有 double 类 型 的 数据 , 直至 读 到 一 个 其 他 类 型 的 数据 为 止 。 例 如 ， 如 果 输 入 
1.23.45.67.8 9.0| 
那么 同 量 temps 将 顺序 输入 5 个 元 素 1.2、3.4、5.6、7.8 和 9.0( 例 如 temps[0|] ==1.2)。 接着 ， 
我 们 用 一 个 字符 '1' 结 束 输 入 , 实际 上 , 任何 一 个 非 double 类 型 的 数据 都 可 以 作为 输入 的 结束 标 
志 。 在 10.6 节 中 , 我 们 还 将 讨论 如 何 终 止 输入 和 处 理 输 入 错误 。 
一 旦 数据 存 人 疝 量 中 , 就 可 以 方便 地 对 其 进行 处 理 。 下 面 的 例子 用 于 计算 温度 的 平均 值 和 中 值 : 


// compute mean and median temperatures 


int main() 

{ 
vector<double> temps; // temperatures 
double temp; 
while (cin>>temp) // read 


temps.push_back(temp); /put into vector 


// compute mean temperature: 

double sum = 0; 

for (int i = 0; i< temps.size(); ++i) sum += temps[i]; 

cout << "Average temperature: " << sum/temps.size() << endl; 


// compute median temperature: 
sort(temps.begin(,temps.end(0); /sort temps 
// “from the beginning to the end” 
cout << "Median temperature: " << temps[temps.size()/2] << endl; 
} 
我 们 可 以 用 一 种 简单 的 方法 计算 向 量 平均 值 : 把 所 有 元 素 累 加 到 变量 sum 中 , 然后 除 以 元 素 的 个 
数 ( 即 temps. size( ) ) : 
// compute average temperature: 
double sum = 0; 
for (inti= 0; i< temps.size(); ++i) sum += temps[i]; 
cout << "Average temperature: " << sum/temps.size() << endl; 


注意 十 二 运算 符 的 使 用 方法 。 
如 果 要 计算 向 量 的 中 值 , 必须 先 对 向 量 进行 排序 ( 中 值 是 指 序列 中 大 于 一 半 元 素 而 小 于 男 一 
半 元 素 的 那个 元 素 )。 我 们 使 用 了 标准 库 排序 算法 sort( ) : 


// compute median temperature: 
Sort(temps,begin(),temps.end0); /sort “from the beginning to the end” 
cout << "Median temperature: " << temps[temps.size()/2] << endl; 


sort( ) 有 两 个 参数 : 待 排序 元 素 序列 的 开始 和 结束 。 在 第 20 章 中 我 们 将 详细 解释 标准 库 函 数 的 算法 
实现 细节 。 幸 运 的 是 ,向量 能 够 “知道 "开始 和 结束 的 具体 位 置 : temps. begint ) 和 temps. end( ) 完全 
能 够 做 到 这 一 点 。 与 size( ) 一 样 , begin( ) 和 end( ) 都 是 问 量 的 成 员 函 数 。 我 们 可 以 用 "向量 名 . ”的 
方式 调用 它们 。 在 排序 所 有 的 温度 数据 后 , 求 中 值 就 很 简单 了 : 中 值 就 是 下 标 为 temps. size( )/2 的 
那个 元 素 。 再 深入 思考 一 下 , 你 会 发 现 我 们 得 到 的 结果 有 可 能 不 是 按照 中 值 定义 得 到 的 结果 (如 果 
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你 这 么 想 了 , 恭喜 你 , 你 已 经 开始 像 一 名 程序 员 一 样 思考 了 ) 。 本 章 的 习题 2 将 解决 这 个 小 问题 。 
4. 6.3 一 个 文本 处 理 的 例子 

本 节 我 们 不 再 用 温度 的 例子 ,因为 我 们 对 温度 数据 并 不 是 特别 有 兴趣 。 对 于 气象 学 家 、 农 学 
家 、 海洋 学 家 等 , 温度 以 及 基于 温度 的 各 类 数据 是 非常 重要 的 。 但 从 程序 员 的 角度 看 , 我 们 感 兴 
趣 的 是 数据 组 织 的 一 般 形式 : 可 以 用 于 各 种 应 用 的 向 量 以 及 对 向 量 的 各 种 操作 。 总 之 , 不 管 你 对 
什么 内 容 感 兴趣 ,只 要 进行 数据 分 析 就 必须 使 用 向 量 ( 或 者 类 似 数据 结构 , 具体 内 容 参 考 第 21 
章 )。 下 面 的 例子 说 明 如 何 建 立 一 个 简单 的 字典 : 


H simple dictionary: list of sorted words 
int main() 
{《 
vector<string> words; 
string temp; 
while (cin>>temp) H read whitespace-separated words 
words.push_back(temp); // put into vector 
cout << "Number of words: " << words.size() << endl; 


sort(words.begin(),words.end0); /sort “from beginning to end” 


for (inti = 0; i< words.size(); ++i) 
if (i==0 | words[i—-1]!=words[il) //is this a new word? 
cout << words[i] << "\n"; 

} 
程序 会 按照 字典 序 输出 向 程序 输入 的 单词 , 同时 消除 重复 的 单词 。 例 如 , 输入 

a man a plan panama 
程序 将 输出 

a 

man 


panama 
plan 


那 我 们 应 该 如 何 停止 输入 呢 ? 或 者 说 , 我 们 应 该 如 何 终 止 这 个 输入 循环 呢 ? 
while (cin>>temp) // read 
words.push_back(temp); // put into vector 


在 做 数值 的 读 入 操作 时 (参见 4. 6. 2 节 )，, 我 们 可 以 通过 输入 非 数 值 字符 来 结束 输入 。 但 在 这 个 程 
序 中 , 这 种 方法 是 不 行 的 。 因 为 所 有 的 输入 字符 者 被 存 和 人 一 个 字符 串 。 幸 运 的 是 , 我们 可 以 利用 
一 些 特殊 字符 作为 终止 符 。 在 3.5.1 节 中 介绍 了 Ctrl +Z 可 以 终止 Windows 窗口 中 的 一 个 输入 流 ， 
Ctrl +D 可 以 终止 一 个 UNIX 窗口 的 输入 流 。 

大 多 数 这 类 程序 与 前 面 的 温度 程序 是 非常 类 似 的 。 事 实 上 , 我 们 在 写 “ 简 单字 典 ” 的 程序 时 ， 
很 多 代码 是 从 “温度 程序 ”中 复制 过 来 的 , 这 里 只 是 添加 了 对 单词 重复 性 的 判断 : 

if (i==0 || words[i- 1]!=words[il) /lis this a new word? 


如 有 果 删 除 这 条 语句 , 则 输出 结果 为 : 


a 

a 

man 
panama 
plan 


我 们 不 喜欢 重复 ， 上面 的 语句 消除 了 重复 性 的 单词 , 它 是 怎样 做 到 的 呢 ? 该 语句 检查 前 一 个 已 输 
出 的 单词 是 否 与 下 一 个 即将 输出 的 单词 相同 (words[i - 1] ! = worqs[ ij] ) : 如 果 不 同 就 输出 这 个 单 
词 ， 否则 不 输出 。 显 然 , 在 打印 第 一 个 单词 的 时 候 , 不 存在 前 一 个 单词 。 因 此 , 还 需要 判断 是 否 
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是 第 一 个 单词 (i ==0)。 把 上 面 两 种 判断 条 件 用 逻辑 或 (11) 组 合 起 来 可 得 : 


if (i==0 || words{i—1]!1=words{i]) His this a new word? 
注意 , 在 比较 字符 串 时 可 以 使 用 ! = (不 等 于 ) 、== (等 于 )、< (小 于 )、<= (小 于 等 于 )、> (大 
于 ) 和 >= (大 于 等 于 ) 等 。 这 些 关 系 运 算 符 依据 字典 序 进行 判断 , 因此 "Ape" 在 " Apple" 和 " Chim- 
panzee" 之 前 。 
试 一 试 编写 一 个 程序 ， 当 遇 到 你 不 喜欢 的 单词 时 会 蜂 鸣 提 醒 。 具 体 实现 思路 如 
下 : 用 cin 输入 单词 并 用 cout 输出 。 如 果 一 个 单词 属于 你 预先 定义 的 不 喜欢 单词 的 集合 ， 
那么 程序 输出 BLEEP 而 不 是 这 个 单词 本 身 。 可 以 用 如 下 方法 定义 不 喜欢 单词 : 
string disliked = "Broccoli"; 


实现 程序 功能 后 ,可 以 尝试 增加 更 多 单词 。 
4.7 语言 特性 


温度 和 字典 程序 用 到 了 本 章 介 绍 的 大 部 分 语言 特性 : 循环 (for 语句 和 while 语句 )、 选 择 语句 
(过 语句 )、 简单 的 算术 运算 (++ 和 += 操 作 )、 比 较 和 逻辑 运算 ( ==，! = 和 11)、 变 量 和 哺 数 ( 例 
如 main( ) ,sort( ) 和 和 size( ) 等 )。 此 外 , 还 用 到 了 标准 库 函 数 , 例如 辐 量 (一 种 数据 元 素 的 容 船 ) 、 
cout( 标准 输出 流 ) 和 sort( ) (一 种 排序 算法 )。 

仔细 回想 一 下 ,你 会 发 现 我 们 已 经 用 到 了 很 多 语言 特性 。 每 一 种 语言 特性 都 表示 了 一 种 基本 
思想 , 将 许多 种 语言 特性 结合 起 来 , 我 们 就 能 写 出 有 用 的 程序 了 。 记 住 , 计算 机 不 是 一 种 只 能 完 
成 固定 功能 的 设备 , 它 可 以 完成 我 们 能 想象 到 的 任何 计算 任务 。 而 且 , 通过 计算 机 与 其 他 设备 的 
结合 , 理论 上 我 们 可 以 用 它 来 完成 任何 任务 。 


过》 简单 练习 


请 逐步 完成 下 列 练习 , 不 要 贪 快 而 跳 过 这 些 简 单 练习 。 请 至 少 使 用 三 组 不 同 的 数据 来 测试 这 些 程序 ， 
欢迎 使 用 更 多 的 测试 数据 。 

1. 编写 一 个 使 用 while 循环 语句 的 程序 , 每 次 循环 输入 两 个 int 数据 并 输出 它们 ， 当 输入 1 后 程序 结束 。 

2. 修改 程序 , 输出 “the smaller value is:” 后 接着 输出 较 小 的 整数 , 输出 “the larger value js: "后 接着 输出 较 大 

的 整数 。 

3. 改进 程序 : 当 两 个 整数 相等 时 , 输出 “the numbers are equal 。 

4. 修改 程序 : 输入 的 数据 改 为 double 型 而 不 是 int 型 。 

5. 修改 程序 : 如 果 两 个 数 的 差 小 于 1. 0/100 的 话 , 输出 “the numbers are almost equal”, 然后 依次 输出 较 大 和 

较 小 的 数 。 z 

6. 修改 循环 体 程序 : 每 次 循环 只 输入 一 个 double 型 数据 ,并 用 两 个 变量 记录 到 目前 为 止 的 最 小 数 和 最 大 数 。 

每 次 循环 输出 当前 输入 的 数据 , 如 果 这 个 数据 是 到 目前 为 止 最 小 或 最 大 的 数 , 在 其 后 分 别 输 出 “the smal- 
lest so far 和 “the largest so far” 。 

7. 为 每 个 double 型 数据 增加 单位 : 例如 数据 可 以 是 10cem、2.5in、5ft 或 3.33m。 程序 可 以 接受 四 种 计量 单 
位 : cm、m、in 和 tt, 假定 转换 系数 是 1m ==100cm、lin ==2. 54cm、1ft == 12in。 注 意 , 将 单位 读 人 一 个 字 
符 串 。 

.改进 程序 使 之 拒绝 没有 单位 或 单位 非法 的 数据 , 例如 y、yard、meter、km 和 gallons 等 。 

.除了 记录 到 目前 为 止 最 大 和 最 小 的 数据 外 , 还 记录 到 目前 为 止 的 数据 累加 和 以 及 数据 个 数 。 当 遇 到 输入 
后, 程序 输出 最 小 、 最 大 、 累 加 和 以 及 数据 个 数 。 注 意 , 因为 计算 累加 和 必须 使 用 同一 计量 单位 ,所 以 
需要 事先 决定 使 用 哪个 计量 单位 , 例如 米 。 

10. 将 上 述 所 有 的 数据 (转换 为 公 尺 ) 存 人 一 个 四 量变 量 , 然后 输出 这 些 数据 。 

11. 在 输出 向 量 中 的 数据 前 , 按照 升序 将 这 些 数据 排序 。 


‘DO oo 


. 什么 是 计算 ? 

. 什么 是 计算 的 输入 和 输出 ? 举例 说 明 。 

， 当 表示 计算 的 时 候 , 程序 员 需 要 谨 记 哪 三 项 要 求 ? 

. 什么 是 表达 式 ? 

. 在 本 章 内 容 中 , 表达 式 和 语句 有 什么 区 别 ? 

. 什么 是 左 值 ? 列 出 要 求 用 左 值 的 运算 符 。 为 什么 这 些 运算 符 需 要 使 用 左 值 ? 
. 什么 是 常量 表达 式 ? 

. 什么 是 字面 常量 ? 

. 什么 是 符号 常量 , 我 们 应 该 如 何 使 用 它 ? 

10. 什么 是 魔 数 ? 举例 说 明 。 

11. 哪些 运算 符 既 可 以 用 于 整 型 也 可 以 用 于 浮 点 型 ? 

12. 哪些 运算 符 只 能 用 于 整 型 而 不 能 用 于 浮 点 型 ? 

13. 哪些 运算 符 可 以 用 于 字符 串 ? 

14. 什么 情况 下 程序 员 更 喜欢 用 switch 语句 而 不 是 站 语句 ? 

15. switch 语句 常见 的 问题 有 哪些 ? 

16. for 循环 语句 的 循环 控制 中 每 一 部 分 的 功能 是 什么 ? 它们 的 执行 顺序 是 怎样 的 ? 
17. 什么 情况 下 应 该 使 用 for 循环 ? 什么 情况 下 应 该 使 用 while 循环 ? 
18. 如 何 输出 一 个 字符 型 数据 的 ASCII 值 ? 

19. 请 说 明 在 函数 定义 中 char foo(int x) 的 含义 是 什么 ? 

20. 什么 情况 下 你 将 在 程序 中 定义 一 个 单独 的 函数 ? 列 出 原因 。 

21， 哪些 操作 可 以 用 于 整 型 数据 而 不 能 用 于 字符 串 ? 

22， 哪 些 操作 可 以 用 于 字符 串 而 不 能 用 于 整 型 数据 ? 

23. 癌 量 中 第 三 个 元 素 的 索引 号 是 多 少 ? 

24， 如 何 用 for 循环 来 打印 输出 四 量 的 所 有 数据 元 素 ? 

25. 语句 vector < char > alphabet(26) ;的 含义 是 什么 ? 

26. 描述 回 量 中 的 push_back( ) 的 含义 。 

27. vector 的 成 员 函 数 begin( ) 、end( ) 和 size( ) 的 功能 是 什么 ? 

28. 为 什么 向 量 被 如 此 广泛 地 使 用 ? 


‘DO 00 777 On 全- 


29， 如 何 将 一 个 向 量 中 的 数据 排序 ? 
人 <》 术语 
抽象 for 语句 push_back( ) begin( ) 阴 数 重复 
计算 这 语 铝 右 值 条 件 语句 增 量 选择 
声明 输入 size( ) 定义 壕 代 sort( ) 
分 治 循环 语句 else 左 值 switch 语句 
end( ) 成 员 了 因数 vector 表达 式 输出 while 语句 
习题 


1. 如 果 你 还 没有 完成 本 章 中 的 “ 试 一 试 ”, 请 先 完成 相关 练习 。 

2. 定义 一 个 序列 的 中 值 恰好 是 序列 的 一 半 元 素 在 它 之 前 而 另 一 半 元 素 在 它 之 后 的 数值 , 修改 4.6.2 节 的 程 
序 使 其 总 是 能 够 输出 中 值 。 提 示 : 中 值 并 不 一 定 是 序列 中 的 元 素 。 

3. 输入 一 组 double 型 数据 到 一 个 向 量 中 , 假设 这 些 数 据 是 党 着 某 一 条 路 径 的 相 邻 城市 间 的 距离 。 要 求 : 计 
算 并 输出 全 部 距离 (所 有 距离 的 总 和 ) ; 搜索 并 输出 相 邻 两 个 城市 间 的 最 小 和 最 大 距离 ; 搜索 并 输出 两 个 
相 邻 城市 间 的 平均 距离 。 
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. 编写 一 个 猜 数 游戏 程序 。 用 户 给 出 一 个 1 到 100 之 间 的 整数 ,程序 通过 提问 来 猜测 用 户 所 想 的 数 是 什么 


(例如 ,“ 你 的 数 小 于 50 吗 ?”" ) , 程序 应 该 能 够 用 不 超过 7 个 问题 来 确定 这 个 数 。 提 示 : 使 用 < 和 <= 运 算 
符 以 及 让 else 语句 编写 程序 。 


. 实现 一 个 简单 的 计算 嚣 程序。 计算 器 应 该 能 够 对 两 个 输入 数据 实现 基本 的 数学 操作 : 加 、 减 5: 乘 、 除 和 取 


模 (余数 )。 程 序 应 该 提示 用 户 输 入 三 个 参数 : 两 个 double 型 数据 和 一 个 表示 操作 的 字符 。 例 如 ， 如 果 输 
人 参数 35.6、24. 1 和 ' +', 程序 将 输出 “35. 6 与 24. 1 的 和 等 于 59.7”。 在 第 6 章 我 们 将 介绍 一 个 更 复 洒 
的 计算 兹 程序 。 


.定义 一 个 能 够 存储 10 个 字符 串 的 向 量 , 分 别 是 "zero" 、"one" 、…"nine" 。 编 写 一 个 能 够 实现 数字 与 其 对 


应 拼写 进行 转换 的 程序 。 例 如 ， 当 输入 7 的 时 候 输出 seven。 同 时 , 该 程序 还 能 够 实现 拼写 形式 到 数字 形 
式 的 转换 , 例如 ， 当 输入 seven 的 时 候 输 出 7。 


修改 习题 5 的 “迷你 计算 器 "程序 , 使 程序 不 但 能 够 接受 数字 形式 的 数据 , 也 能 够 接受 拼写 形式 的 数据 。 
: 有 一 个 古老 的 故事 , 讲述 的 是 一 个 皇帝 为 了 感谢 国际 象棋 的 发 明 人 , 答应 这 个 发 明 人 可 以 提出 自己 的 党 


赐 要 求 。 发 明 人 提出 的 要 求 是 : 在 棋盘 的 第 一 个 格子 里 放 1 粒 米 , 在 第 二 个 格子 里 放 2 粒 米 , 第 三 个 格子 
里 放 4 粒 米 , 依 此 类 推 。 每 次 都 加 倍 直 到 放 满 棋盘 的 所 有 64 个 格子 为 止 。 这 个 要 求 听 起 来 很 谦虚 , 但 实 
际 上 全 国 所 有 的 米 都 不 够 支付 这 个 赏赐 。 编 写 程序 来 计算 一 下 发 明 家 要 获得 至 少 1000 粒 米 需要 多 少 个 
棋盘 格子 ”至少 1000000 粒 米 呢 ? 至 少 1000000000 粒 米 呢 ? 当然 ， 你 需要 设计 一 个 循环 , 也 许 还 需要 一 
个 整 型 变量 记录 当前 所 处 的 格子 , 一 个 整 型 变量 记录 当前 格子 的 米粒 数 , 一 个 整 型 变量 记录 以 前 所 有 格 
子 的 米粒 数 。 建 议 你 在 每 次 循环 中 都 输出 所 有 的 变量 值 , 并 观察 一 下 会 发 生 什 么 情况 。 


. 尝试 计算 习题 8 中 发 明 家 要 求 的 米粒 的 总 量 是 多 少 ? 你 会 发 现 这 个 数字 是 如 此 大 , 以 至 于 int 或 double 都 


无 法 保存 。 注 意 观察 当 数值 太 大 导致 int 或 double 无 法 保存 时 会 发 生 什么 。 如 果 使 用 int 的 话 , 你 可 以 准 
确 计算 出 米 数 总 量 的 最 大 棋盘 的 格子 数目 是 多 少 ? 使 用 double 呢 ? 


10， 纺 写 一 个 " 石头、 剪刀、 布 " 的 游戏 程序 。 如 果 你 不 邹 悉 这 个 游戏 , 可 以 先 调查 一 下 。 对 于 程序 员 来 说 ， 


11. 


调查 是 日 常 工作 的 一 部 分 。 用 switch 语句 解决 这 个 习题 。 程 序 将 随机 给 出 下 一 个 操作 ( 即 石头 、 剪 刀 或 
布 是 随机 出 现 的 ) 。 目 前 , 真正 的 随机 性 是 很 难 实现 的 , 因此 在 程序 中 可 以 用 存 有 一 个 数据 序列 的 向 量 
来 处 理 , 其 中 向 量 的 每 个 数据 元 素 表示 程序 的 下 一 个 操作 。 根 据 这 个 向 量 中 的 数据 元 素 , 程序 的 每 次 运 
行将 执行 相同 的 动作 ,因此 你 需要 用 户 输 入 某 些 值 。 尝 试 做 一 些 变化 , 使 得 用 户 很 难 猜 出 程序 的 下 一 个 
动作 是 什么 。 

编写 程序 找 出 1 到 100 之 间 的 所 有 素数 。 一 种 可 行 的 方法 是 用 一 个 函数 来 判断 一 个 数 是 否 是 素数 ( 即 判 
断 一 个 数 是 否 能 够 被 小 于 它 的 素数 整除 ) ， 可 以 将 素数 存储 在 一 个 vector 类 型 的 素数 表 中 (例如 , 如果 这 
个 vector 变量 名 为 primes、primes[0] ==2、primes[1] ==3、primes[2] ==5 等 )。 然 后 用 一 个 1 到 100 的 
循环 逐个 判断 每 个 数 是 否 是 素数 , 并 将 其 中 的 素数 存储 在 一 个 vector 中 。 然 后 , 编写 男 一 个 循环 来 显示 所 
有 的 素数 。 你 可 以 比较 一 下 你 找到 的 素数 和 素数 表 primes 的 结果 。 其 中 , 2 是 第 一 个 素数 。 


. 修改 上 面 的 习题 , 要 求 程 序 有 一 个 输入 值 max, 并 找 出 从 1 到 max 的 所 有 素数 。 
. 使 用 名 为 " 埃 拉 托 斯 特 尼 筛 法“( Sieve of Eratosthenes) 的 经 典 方法 , 编写 程序 找 出 1 到 100 之 间 的 所 有 素 


数 。 如 果 不 了 解 这 个 方法 , 你 可 以 通过 互联 网 搜索 相关 资料 。 


. 修改 上 面 的 习题 , 要 求 程 序 有 一 个 输入 值 max, 并 找 出 从 1 到 max 的 所 有 素数 。 
. 编写 程序 , 要 求 : 有 一 个 输入 值 n, 输出 结果 是 前 n 个 素数 。 
.编写 程序 , 找 出 一 组 输入 数据 中 最 大 和 最 小 的 数据 。 在 一 组 数据 中 出 现 次 数 最 多 的 数 称 为 mode。 要 求 : 


输入 一 组 正 整数 , 程序 能 够 找 出 该 组 数据 的 mode。 


.编写 程序 , 要 求 : 输入 一 组 字符 串 , 找 出 该 组 字符 串 中 最 大 、 最 小 和 mode 字符 串 。 
. 编写 解 一 元 二 次 方程 的 程序 。 一 元 二 次 方程 的 一 般 形式 为 


ac +bx+c=0 
如 果 你 不 知道 如 何 解 一 元 二 次 方程 , 可 以 先 调查 一 下 。 记 住 , 在 一 个 程序 员 教 会 计算 机 如 何 解决 问题 
前 , 程序 员 必 须 先 清楚 如 何 解 决 它 。 程 序 的 输入 数据 a、b 和 c 为 double 型 ; 一 元 二 次 方程 有 两 个 解 , 因 
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此 程序 的 输出 包括 两 个 解 xl 和 双 。 

19. 编写 程序 , 其 输入 是 一 组 名 字 和 数值 对 。 例 如 ,Joe 17 和 Barbara 22 等 。 对 于 每 一 个 名 字 - 数值 对 ,名 
字 存 人 名 为 names 的 向 量 中 , 数值 存 人 名 为 scores 的 向 量 对 应 位 置 中 (例如 ,如 果 names[7]="Joe", 那 
么 scores[7] =17) 。 当 输入 No more 时 , 终止 输入 (这 里 more 将 导致 读 人 一 个 整 型 数据 的 失败 ) 。 注 意 ， 
要 检查 名 字 的 唯一 性 , 相同 的 名 字 将 导致 程序 中 断 并 输出 一 个 错误 信息 。 最 后 , 按照 每 行 一 个 名 字 - 数 
值 对 的 形式 输出 所 有 数据 。 

20. 修改 习题 19 的 程序 ， 当 你 输入 一 个 名 字 后 , 程序 将 输出 相应 的 成 绩 或 者 输出 “name not found”。 

. 修改 习题 19 的 程序 ， 当 你 输入 一 个 整数 后 , 程序 将 输出 所 有 对 应 的 名 字 或 者 ”score not found”。 


21 
<》 附 言 

从 哲学 的 观点 看 , 用 计算 机 能 做 的 所 有 事情 , 你 现在 都 可 以 去 做 了 , 剩 下 的 就 是 一 些 具体 细节 了 。 由 于 
你 是 一 个 编程 的 初学 者 , 我 们 要 郑重 地 提醒 你 : 各 种 编程 的 细节 和 技巧 对 你 来 说 非常 重要 。 通 过 本 章 的 内 
容 , 你 已 经 练习 了 许多 计算 技巧 : 各 种 变量 的 使 用 (包括 vector 和 string) , 算术 和 比较 运算 符 的 使 用 , 选择 和 
循环 语句 等 。 利 用 这 些 基 本 单元 , 你 可 以 完成 许多 计算 任务 。 你 也 练习 了 文本 和 数字 的 输入 和 输出 , 所 有 
的 输入 和 输出 都 可 以 表示 为 文本 形式 (包括 图 形 ) 。 利 用 一 系列 函数 , 你 可 以 很 好 地 组 织 你 的 程序 。 接 下 来 
你 需要 完成 的 任务 是 写 好 代码 ， 即 你 的 程序 要 正确 、 可 维护 和 高 效 。 更 重要 的 是 , 你 要 路 路 实 实地 努力 学 习 
如 何 写 好 程序 。 


第 5 章 销 误 


“我 已 经 意识 到 从 现在 开始 我 的 大 部 分 时 间 将 花 在 查找 和 纠正 自己 的 错 





Maurice Wilkes, 1949 


在 本 章 中 , 我 们 将 讨论 程序 的 正确 性 、 错 误 和 错误 处 理 。 如 果 你 是 一 个 新 手 , 你 会 发 现 这 种 
讨论 有 时 有 点 抽象 , 有 时 又 显得 过 于 细节 化 了 。 错 误 处 理 真 的 很 重要 吗 ? 是 的 , 它 非常 重要 。 在 
你 写 出 别人 愿意 使 用 的 程序 前 , 你 需要 掌握 几 种 错误 处 理 方 法 。 我 们 要 做 的 是 向 你 展示 如 何 “ 像 
一 个 程序 员 一 样 思考 ”。 它 是 建立 在 对 细节 和 替代 方案 细致 分 析 基 础 上 的 各 种 抽象 策略 的 组 合 。 


5.1 介绍 


在 前 面 章节 的 示例 和 练习 中 , 我 们 已 经 多 次 提 到 了 错误 处 理 的 相关 内 容 , 对 于 错误 你 应 该 已 
经 有 了 一 些 初步 的 认识 。 在 编写 程序 的 时 候 , 错误 是 不 可 避免 的 。 当 然 ,最 后 的 程序 必须 是 没有 
错误 的 , 至少 不 存在 我 们 不 可 接受 的 错误 。 
错误 的 分 类 有 很 多 种 , 例如 : 
e 编译 时 错误 : 由 编译 器 发 现 的 错误 。 根 据 所 违背 的 语法 规则 , 编译 时 错误 还 可 以 进一步 细 
分 , 例如 : 
* 语法 错误 
a 类 型 错误 
e 连接 时 错误 : 当 连 接 器 试图 将 对 象 文 件 连接 为 可 执行 文件 时 发 现 的 错误 。 
e 运行 时 错误 : 程序 运行 时 发 现 的 错误 。 运 行 时 错误 可 以 被 进一步 细 分 为 以 下 几 种 : 
=。 由 计算 机 检测 出 的 错误 (硬件 或 操作 系统 ) 
“ 由 库 检 测 出 的 错误 (例如 标准 库 ) 
a 由 用 户 代 码 检 测 出 的 错误 
。 过 辑 错 误 : 由 程序 员 发 现 的 会 导致 不 正确 结果 的 错误 。 
理想 情况 下 , 程序 员 的 任务 是 消除 所 有 的 错误 。 但 在 实际 中 , 这 经 常 是 不 可 行 的 。 事 实 上 ， 
对 于 一 个 实际 程序 来 说 , 如 何 准确 定义 “所 有 错误 "都 是 很 困难 的 。 如 果 我 们 把 一 台 正 在 执行 程序 
的 计算 机 的 电源 线 拔 掉 , 那么 这 会 是 一 种 你 认为 的 错误 吗 ? 在 多 数 情况 下 , 答案 显然 是 否定 的 。 
但 是 , 如 果 我 们 讨论 的 是 医疗 设备 的 监控 程序 或 者 电话 交换 机 的 控制 程序 的 话 , 用 户 会 认为 包括 
程序 在 内 的 整个 系统 出 了 问题 。 用 户 只 关心 结果 , 而 不 关心 导致 这 种 情况 的 原因 是 计算 机 掉 电 ， 
还 是 宇宙 射线 损坏 了 存放 程序 的 存储 器 。 因 此 , 问题 转化 为 “我 们 的 程序 能 够 检测 到 错误 吗 ”。 除 
非特 别 说 明 , 我 们 会 假定 你 的 程序 : 
1) 对 于 所 有 合法 输入 应 输出 正确 结果 。 
2) 对 于 所 有 非法 输入 应 输出 错误 信息 。 
3) 不 需要 关心 硬件 故障 。 
4) 不 需要 关心 系统 软件 故障 。 
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5) 发 现 一 个 错误 后 , 允许 程序 终止 。 

不 需要 事先 考虑 假设 3) 、4) 或 5) 情 况 的 程序 超出 了 本 书 的 内 容 范 围 。 但 是 , 假设 1) 和 2) 是 
属于 程序 员 的 基本 专业 能 力 范畴 的 ,而 培养 这 种 专业 能 力 正 是 我 们 的 目标 之 一 。 即 使 在 实际 中 我 
们 也 不 能 100% 达到 理想 目标 , 但 它 是 我 们 努力 的 方向 。 

在 我 们 编写 程序 的 时 候 ， 出 现 错误 是 很 自然 的 和 不 可 避免 的 。 问 题 是 我 们 应 该 如 何 处 理 错 
误 ? 我 们 估计 在 开发 正式 软件 时 , 90% 以 上 的 工作 是 放 在 如 何 避 免 、 查 找 和 纠正 错误 上 。 对 于 一 
些 可 靠 性 至 关 重要 的 程序 来 说 , 这 一 比例 甚至 要 更 高 。 对 于 小 程序 来 说 , 你 可 以 把 错误 处 理 做 得 
很 好 。 但 是 , 如 果 你 很 马虎 , 你 也 可 能 做 得 很 糟糕 。 

总 之 , 我 们 有 下 面 三 种 方法 来 编写 可 接受 的 软件 : 

。 精心 组 织 软件 结构 以 减少 错误 。 

。 通 过 调试 和 测试 , 消除 大 部 分 程序 错误 。 

。 确定 余下 的 错误 是 不 重要 的 。 

上 述 任 何 一 种 方法 都 不 能 保证 完全 消除 错误 ,我 们 必须 同时 使 用 上 述 三 种 方法 。 

在 开发 可 靠 程序 的 时 候 , 经 验 往往 会 起 巨大 作用 。 这 意味 着 , 根据 用 途 的 不 同 , 程序 可 以 运 
行 在 可 以 接受 的 错误 率 下 。 请 不 要 忘记 , 理想 情况 下 , 程序 总 是 做 正确 的 事 。 虽 然 我 们 一 般 只 能 
接近 这 一 理想 情况 , 但 这 不 是 我 们 不 努力 工作 的 借口 。 


5.2 错误 的 来 源 


错误 的 来 源 包括 : 

。 缺少 规划 : 如 果 没 有 事先 规划 好 程序 要 做 什么 , 我 们 不 可 能 充分 检查 所 有 “死角 ”, 并 确认 
所 有 的 可 能 情况 都 会 被 正确 处理 ( 即 对 任意 输入 程序 都 能 给 出 正确 结果 或 者 充分 的 错误 
信息 )。 

。 不 完备 的 程序 : 在 软件 开发 过 程 中 ,显然 会 有 一 些 我 们 没有 考虑 到 的 情况 ,这 是 不 可 避免 
的 。 我 们 必须 要 达到 的 目标 是 掌握 我 们 何 时 能 够 处 理 所 有 情况 。 

。 意外 的 参数; 图 数 会 使 用 参数 。 如 果 为 画 数 输入 了 一 个 不 能 处 理 的 参数 的 话 , 我 们 会 遇 到 
问题 。 例 如 ,为 求 平 方 根 的 标准 库 函 数 输 入 -1.2: sqrt( -1.2)。 由 于 sqrt( ) 的 输入 和 输 
出 都 是 double, 因此 在 这 种 情况 下 , 它 不 可 能 输出 正确 结果 。5. 5. 3 节 将 讨论 这 种 情况 。 

。 意外 的 输入 : 典型 的 程序 输入 包括 来 目 键盘 、 文 件 、 图 形 用 户 界面 和 网 络 等 的 输入 。 对 于 
这 些 输入 , 程序 一 般 都 设 定 了 许多 前 提 假 设 。 例 如 ,用 户 会 输入 一 个 数字 。 但 是 , 如 果 用 
户 输入 的 是 “ 喂 , 闭 嘴 !1” 而 不 是 期 望 的 数字 , 程序 会 怎样 呢 ?5. 6.3 节 和 10.6 节 将 讨论 这 
类 问题 。 

。 意外 的 状态 : 多 数 程 序 都 保留 有 很 多 系统 各 个 部 分 所 使 用 的 数据 (“状态 ”)。 例 如 ,地 址 
表 、 电话 链 、 温度 记 录 等 。 如 果 这 些 数 据 是 不 完整 的 或 者 错误 的 , 那 应 该 如 何 处 理 呢 ? 无 
疑 程序 的 各 个 部 分 仍然 应 该 正常 运转 。26. 3.5 市 将 讨论 这 类 问题 。 

。 远 辑 错误 : 这 表示 程序 没有 按照 我 们 所 期 望 的 那样 运行 。 我 们 不 得 不 查找 并 修正 这 些 问 
题 。 在 6.6 节 和 6.9 节 中 我 们 将 给 出 这 类 问题 的 例子 。 

上 述 列表 可 以 用 于 实际 开发 。 当 我 们 开发 一 个 软件 的 时 候 , 可 以 把 上 述 列表 作为 检查 表 。 在 

我 们 认为 已 经 排除 了 所 有 潜在 的 错误 来 源 之 前 , 软件 是 不 能 被 交付 使 用 的 。 实 际 上 ， 从 项 目 开始 
时 , 我 们 就 始终 要 关注 错误 处 理 。 因 为 , 没有 认真 考虑 过 错误 处 理 的 软件 几乎 是 不 可 能 正常 工作 


的 , 它 还 会 被 重新 编写 一 遍 。 
5.3 编译 时 错误 


在 编写 程序 的 时 候 ， 编 译 器 是 检查 错误 的 第 一 道 防线 。 在 生成 可 执行 文件 之 前 ， 编 详 岩 
通过 分 析 代 码 来 检查 语法 和 类 型 错误 。 只 有 编译 器 认为 代码 完全 符合 语法 规范 , 编译 过 程 
才能 继续 下 去 。 编 译 器 发 现 的 大 部 分 错误 都 很 简单 ， 属 于 ”低级 错误 ”。 它 们 一 般 是 由 源 代 
码 的 编辑 错误 导致 的 。 其 他 一 些 问 题 则 是 由 程序 各 个 部 分 之 间 的 交互 引起 的 。 作 为 初学 者 ， 
你 可 能 会 党 得 编译 器 很 繁琐 ,但 是 当 你 学 会 使 用 一 些 语言 特性 ( 特别 是 类 型 系统 ) 来 直接 表 
达 你 的 思想 时 , 你 将 会 认识 到 编译 器 的 错误 检查 功能 的 价值 。 如 果 没 有 编译 器 ,乏味 的 除 错 
工作 将 会 花费 你 大 量 的 时 间 。 

举例 来 说 , 下 面 是 一 个 简单 函数 的 一 些 调用 : 

int area(int length, int width);  // calculate area of a rectangle 
5. 3. 1 语法 错误 

如 果 我 们 按照 如 下 方式 调用 area( ) , 会 有 什么 结 采 呢 : 


int s1 = area(7; H error: ) missing 

int $2 = areal(7) / error: ; missing 

Int s3 = area(7); /error: intis nota type 

int s4 = area(7);  //error: non-terminated character (' missing) 


上 面 每 一 行程 序 都 有 一 个 语法 错误 , 即 它们 不 符合 C++ 语 言 的 语法 规范 , 因此 编译 器 会 拒绝 
它们 。 不 幸 的 是 ,对 你 ( 即 程序 员 ) 来 说 , 理解 语法 错误 的 报告 信息 往往 不 是 那么 容易 。 为 了 确定 
错误 , 编译 器 往往 会 读 取 更 多 的 信息 。 这 会 导致 即使 是 一 个 小 错误 (往往 在 发 现 这 个 错误 时 , 你 
会 觉得 不 可 思议 , 自己 怎么 会 犯 这 种 低级 错误 ) , 编译 器 也 会 报告 很 多 繁杂 信息 , 甚至 会 指向 程序 
中 的 其 他 行 。 因 此 , 如 果 你 在 编译 器 所 指向 的 错误 行 中 没有 发 现 错误 的 话 , 还 应 该 检查 一 下 前 几 
行程 序 是 否 有 错 。 

需要 注意 的 是 , 编译 器 并 不 知道 你 想 做 什么 。 它 只 会 报告 你 所 做 的 是 否 有 错 , 而 不 会 报告 你 
想 做 的 是 否 有 错 。 例 如 , 在 上 面 的 例子 中 , s3 的 声明 有 错 , 但 是 编译 器 不 会 告诉 你 : 

“你 拼 错 了 int, i 不 要 大 写 。” 

而 是 报告 如 下 信息 : 

“语法 错误 : 标识 符 “s3' 前 丢失 ;””。 

““s3 没有 存储 类 型 或 标识 符 类 型 ”。 

“Int 没有 存储 类 型 或 标识 符 类 型 ”。 

在 你 习惯 并 理解 这 些 信息 含义 前 , 这 些 信 息 是 很 令 人 费解 的 。 对 于 同一 代码 , 不 同 的 编译 器 
可 能 会 给 出 不 同 的 错误 信息 。 辛 运 的 是 , 你 会 很 快 习惯 理解 这 些 信息 的 。 实 际 上 ， 上 面 这 些 令 人 
费解 的 信息 可 以 解释 为 : 

“在 s3 前 有 一 个 语法 错误 , 需要 检查 一 下 Int 或 者 s3 的 类 型 。” 

实际 上 , 发 现 这 些 问 题 并 不 是 一 件 很 困难 的 事 。 

试 一 试 ”尝试 编译 一 下 上 面 的 例子 , 看 看 编译 器 的 返回 信息 是 什么 。 
5. 3.2 ”类 型 错误 

一 旦 排除 了 语法 错误 , 编译 器 就 会 开始 检查 类 型 错误 : 它 将 会 检查 你 所 声明 的 变量 和 函数 的 

类 型 (或 者 发 现 你 忘记 了 声明 类 型 ) , 检查 赋予 变量 或 函数 的 数值 或 表达 式 的 类 型 以 及 传递 给 函数 
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参数 的 数值 或 表达 式 的 类 型 ,例如 : 


int x0 = arena(7); /f error: undeclared function 
int x1 = area(7); // error: wrong number of arguments 
int x2 = area("seven",2);  //error: 1st argument has a wrong type 


让 我 们 仔细 分 析 一 下 这 些 错误 : 

1) 对 于 arena(7), 我们 将 area 错 写 为 arena。 因 此 编译 器 认为 我 们 是 要 调用 函数 arena。( 编 
译 器 还 有 其 他 “想法 " 吗 ? 这 就 是 前 文 所 说 的 ,编译 器 是 不 知道 你 想 做 什么 的 。) 假 设 没有 函数 are- 
na( ) ， 你 会 得 到 未 定义 函数 的 错误 信息 。 如 果 存 在 表 数 arena( ) 并 且 这 个 函数 能 够 接受 7 作为 输 
人 参数 的 话 , 你 会 遇 到 一 个 更 大 的 麻烦 : 程序 将 会 被 正确 编译 , 但 是 它 不 会 按照 你 预想 的 那样 去 
运行 (这 是 一 个 逻辑 错误 , 详 见 5.7 节 )。 

2) 对 于 area(7) ,编译 器 检查 到 的 错误 是 参数 个 数 不 匹 配 。 对 于 C++ 语言 ， 函 数 调用 必须 使 
用 正确 的 参数 个 数 、 参 数 类 型 和 顺序 。 在 合理 使 用 类 型 检查 系统 时 候 , 它 可 以 作为 运行 时 的 错误 
检查 工具 ( 详 见 14. 1 节 )。 

3) 对 于 area(" seven" , 2) ， 你 可 能 期 望 编译 器 能 够 识别 出 "seven" 表示 的 是 数字 7 ,但 它 做 不 
到 这 点 。 当 一 个 函数 需要 输入 一 个 整数 的 时 候 , 我 们 不 能 给 它 一 个 字符 串 。C ++ 确实 文 持 一 些 隐 
含 的 类 型 转换 (参见 3.9 节 ) , 但 不 包括 string 到 int 的 转换 。 编 译 器 不 会 试图 去 猜测 你 所 要 表示 的 
含义 。 不 然 , 你 认为 area("Hovellane" , 2)、area("7, 24) 和 area( "sieben" , "zwei" ) 表 示 什 么 含义 
呢 ? 

上 述 只 是 一 些 简单 的 示例 。 编 译 器 能 够 发 现 更 多 的 错误 信息 。 

试 一 试 ”尝试 编译 一 下 上 面 的 例子 ， 看 看 编译 器 的 返回 信息 是 什么 。 尝 试 考虑 一 下 

你 所 遇 到 的 更 多 的 错误 信息 。 
5. 3.3 警告 

当 你 使 用 编译 器 的 时 候 , 你 会 希望 它 足够 聪明 , 能 够 理解 你 要 表达 的 意思 ,也 就 是 说 ,你 可 
能 会 希望 编译 器 报告 的 一 些 错误 并 不 是 真正 的 错误 。 这 种 想法 是 很 目 然 的 ,但 令 人 惊奇 的 是 ， 当 
你 有 了 一 定编 程 经 验 后 , 你 会 希望 编译 器 能 够 拒绝 更 多 代码 , 而 不 是 更 少 。 看 下 面 的 例子 : 


int x4 = area(10, 一 7); // OK: but what is a rectangle with a width of minus 7? 
int x5 = area(10.7,9.3); // OK: but calls area{10,9) 
char x6 = area(100, 9999); // OK: but truncates the result 


.对 于 双 , 我 们 没有 从 编译 器 得 到 错误 信息 。 对 于 编译 器 来 说 ，area(10, -7) 是 正确 的 : 
area( ) 需要 两 个 整 型 参数 , 你 给 定 了 两 个 , 而 没有 人 规定 参数 必须 是 正 数 。 

对 于 x5 来 说 , 好 的 编译 器 将 给 出 警告 信息 : double 型 参数 10.7 和 9. 3 被 截取 为 int 型 参数 10 
和 9( 参 见 3.9.2 节 )。 然 而 ,( 旧 的 ) 语 法 规则 认为 可 以 隐 式 地 将 double 转换 为 int, 因此 编译 表 不 
会 拒绝 项 数 调 用 area(10.7,9.3)。 

对 x6 的 初始 化 存在 与 area(10.7,9.3) 同 样 的 问题 。area(100 ,9999 ) 的 int 型 返回 值 ， 即 
999900 , 被 赋 给 一 个 char 型 变量 。x6 最 有 可 能 的 结果 是 “截取 值 ”-36。 同 样 , 一 个 好 的 编译 器 将 
会 报告 相关 的 警告 信息 ， 即 便 ( 旧 的 ) 语 法 规则 不 拒绝 相关 代码 。 

当 获 得 一 定编 程 经 验 后 , 你 将 学 会 如 何 脱离 编译 器 去 检查 错误 和 避免 编译 器 的 弱点 。 但 是 ， 
不 要 过 分 自信 :“ 程 序 已 编译 "并 不 意味 着 它 能 够 运行 。 即 使 它 能 够 运行 ,在 你 消除 逻辑 错误 前 ， 
通常 程序 给 出 的 也 是 错误 的 结果 。 


5.4 连接 时 错误 
一 个 程序 一 般 包括 几 个 独立 的 编译 部 分 , 称 为 翻译 单元 。 程 序 中 每 一 个 函数 在 所 有 翻译 单元 
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中 的 声明 类 型 必须 严格 一 致 。 我 们 使 用 头 文件 来 保证 这 一 点 , 详 见 8. 3 范 轩 并 有 程序 中 的 每 将 
函数 只 能 定义 一 次 。 如 果 上 述 两 条 规则 的 任意 一 条 被 违反 的 话 , 连接 器 将 报错 。 如 何 避 免 连接 错 
误 将 在 8. 3 节 中 讨论 。 下 面 是 一 个 典型 的 程序 连接 错误 示例 : 


int arealint length, int width); /calculate area of a rectangle 


int main() 
{ 
int x = area(2,3); 


除非 我 们 在 男 一 个 源 文件 中 定义 了 area( ), 并 且 将 该 源 文件 编译 得 到 的 代码 与 当前 代码 连 
接 , 否则 连接 器 将 报告 没有 找到 area( ) 的 定义 。 

同时 , area( ) 的 定义 必须 与 我 们 的 调用 具有 严格 相同 的 类 型 (包括 返回 值 类 型 和 参数 类 
型 ) , 即 

int arealint x, int y) {/* ...*/} Wour areal) 
具有 相同 名 称 但 是 类 型 不 同 的 函数 将 不 会 被 匹配 上 , 并 被 忽略 : 

double area(double x, doubleW{A“.. .wh /not “our” areal) 

int areal(int x, int y, char unit) {/* ... */} I not "our” areal) 

需要 注意 的 是 , 孙 数 名 的 拼写 错误 并 不 总 会 导致 连接 错误 。 但 是 , 当 过 到 一 个 未 定义 阴 数 被 
调用 时 , 编译 器 将 立刻 报告 错误 信息 。 这 一 点 很 好 : 编译 时 错误 早 于 连接 时 错误 被 发 现 有 助 于 错 
误 的 及 早 排除 。 

正如 上 文 所 述 ,函数 的 连接 规则 同样 适用 于 程序 的 其 他 实体 , 例如 变量 和 类 型 : 具有 同一 名 
字 的 实体 只 能 有 一 个 定义 , 但 是 可 以 有 多 个 声明 , 并 且 所 有 声明 具有 相同 的 类 型 。 


5.5 运行 时 销 误 


如 果 你 的 程序 没有 编译 时 错误 和 连接 时 错误 的 话 , 那么 它 就 能 运行 了 。 现 在 乐趣 才 真 正 开 
始 , 在 你 编写 程序 的 时 候 , 你 能 够 轻易 地 发 现 错误 。 但 是 , 对 于 运行 程序 时 发 现 的 错误 , 你 可 能 
很 难 确定 如 何 解 决 它 , 例如 : 


int arealint length, int width)  //calculate area of a rectangle 


return length*width; 


} 
int framed_areal(int x, int y) / calculate area within frame 
{ 

return area(x—2,y—2); 
} 
int main() 
{ 

int x = -1; 

inty = 2; 

int z= 4; 

N's 


int areal = area(x,y); 

int area2 = framed areall1,z); 

int area3 = framed arealy,7); 

double ratio = double(areai)/area3; //convert to double to get 
ji floating-point division 
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在 程序 中 , 我 们 使 用 变量 x、y、z( 而 不 是 直接 使 用 数值 作为 参数 ), 这 使 得 阅读 代码 的 人 和 编译 器 
更 难 发 现 问题 。 但 是 , 这 些 调用 会 把 负数 赋 给 areal 和 area2， 导 致 面积 表 示 为 负数 。 我 们 能 够 接 
受 这 种 明显 违背 数学 和 物理 规律 的 错误 结果 吗 ? 如 果 不 能 , 应 该 由 谁 来 检测 这 种 错误 : area( ) 的 
调用 者 或 者 函数 本 身 ? 这 种 错误 又 应 该 如 何 报告 呢 ? 

在 回答 这 些 问 题 之 前 , 我 们 先 看 看 上 面 代码 中 ratio 的 计算 。 这 条 语句 看 上 去 没有 什么 问题 。 
但 你 是 否 发 现 了 什么 不 对 的 地 方 了 吗 ? 如 果 没 有 , 再 仔细 看 看 : area3 的 值 是 0, 因此 在 double( ar- 
eal ) /area3 中 将 除 以 0。 这 会 导致 一 个 硬件 检测 错误 并 终止 程序 , 同时 报 出 一 个 与 硬件 相关 的 错 
误 信息 , 这 类 错误 就 是 运行 时 错误 。 如 果 你 或 者 你 的 用 户 没 有 及 时 发 现 并 解决 这 类 错误 的 话 , 在 
程序 运行 时 这 类 错误 就 可 能 出 现 。 对 于 这 类 “硬件 错误 ”, 大 多 数 人 的 容忍 度 都 很 低 , 因为 他 们 不 
了 解 程序 的 细节 而 仅仅 知道 “ 某 个 地 方 出 了 问题 ”, 这 点 信息 对 于 处 理 问 题 帮助 很 小 。 在 这 种 情况 
下 ,人 们 会 很 生气 并 对 程序 的 提供 者 抱怨 连连 。 

让 我 们 再 检查 一 下 area( ) 的 参数 错误 问题 。 我 们 发 现 有 下 面 两 种 解决 办 法 

1) 让 area( ) 的 调用 者 来 处 理 不 正确 的 参数 。 

2) 让 area( )( 被 调用 函数 ) 来 处 理 不 正确 的 参数 。 

5. 5. 1 调用 者 处 理 错误 

先 看 看 第 一 种 方法 (“让 用 户 意 识 到 问题 ") 。 如 果 area( ) 是 一 个 由 我 们 不 能 修改 的 库 提 供 的 
函数 , 我 们 将 选择 这 种 方法 。 不 管 怎 样 , 这 都 是 一 个 合适 的 选择 。 

在 main( ) 一 数 中 保护 area(x, y) 的 调用 是 很 容易 的 : 

if (x<=0) error("non-positive x"); 


if (y<=0) error("non-positive y"); 
int areal = area(x,y); 


的 确 , 当 你 发 现 一 个 错误 后 ,唯一 的 问题 就 是 如 何 解决 它 。 这 里 我 们 调用 了 一 个 函数 
error( ) , 假设 它 能 够 做 一 些 错误 处 理工 作 。 实 际 上 , 在 std_lib_facilities. h 中 我 们 提供 了 一 个 error 
( ) 函数 , 它 能 够 终止 程序 运行 并 将 字符 串 参 数 作为 系统 错误 信息 和 输出。 如 果 你 希望 输出 自己 的 错 
误 信息 并 做 其 他 的 操作 , 参看 runtime_error( 人 参见 3. 6. 2 节 、7.3 节 、7.8 节 和 附录 B.2. 1) 。 对 于 初 
学 者 来 说 , 这 已 经 足够 了 , 它 还 可 以 作为 更 复杂 错误 处 理 的 实例 。 

如 果 我 们 不 需要 明确 区 分 每 一 个 参数 , 我 们 还 可 以 简化 程序 如 下 : 


if (x<=0 || y<=0) error("non-positive area() argument"); /|| means or 
int areal = area(x,y); 


为 了 对 area( ) 的 参数 实现 完全 保护 , 我 们 需要 使 用 framed_area( ) 函数 , 程序 改写 为 : 
if (z<=2) 
error("non-positive 2nd area() argument called by framed_area()”); 
int area2 = framed_area(1,2); 
if (y<=2 || z<=2) 
error("non-positive area() argument called by framed_area()"); 
int area3 = framed_area(yYZz); 


这 看 上 去 有 些 混乱 ,而且 还 存在 一 些 基本 问题 。 上 面 的 程序 只 有 在 我 们 确切 了 解 framed_area( ) 如 
何 使 用 area( ) 的 情况 下 才能 编写 正确 。 要 知道 framed_area( ) 对 每 一 个 参数 都 减 了 2。 我 们 不 得 不 
了 解 这 么 多 细节 情况 。 如 果 有 人 把 framed_area( ) 修改 为 减 1 而 不 是 2, 我 们 又 该 怎么 办 呢 ? 如 果 
这 种 情况 发 生 , 我 们 不 得 不 查找 程序 中 的 每 一 个 framed_area( ) 调用 , 并 做 相应 的 修改 。 这 称 为 
“ 易 碎 ”代码 ,因为 它 很 容易 被 破坏 。 这 也 是 一 个 “ 魔 数 ” 的 例子 (参见 4.3.1 节 ) 。 为 了 减少 程序 
的 “ 易 碎 性 ”, 我 们 可 以 在 framed_area( ) 中 用 一 个 命名 常量 代替 具体 的 数值 ; 


const int frame_width = 2; 
int framed_areafint x, inty)  // calculate area within frame 
return area(x—frame_width,y~-frame_width); 
} 
这 个 常量 也 可 以 被 framed_area( ) 的 调用 者 使 用 : 
if (1-frame_width<=0 | z-frame_width<=0) 
error("non-positive argument for areal() called by framed._area()"); 
int area2 = framed. area(1,2); 
if (y~frame._ width<=0 || z~-frame_width<=0) | 
error("non-positive area() argument called by framed._area()"); 
int area3 = framed_areal(y,2); 


仔细 看 看 上 面 的 代码 , 你 能 确定 它 是 正确 的 吗 ? 它 形式 上 床 亮 吗 ? 它 易 读 吗 ? 事实 上 , 我 们 发 现 
它 很 糖 料 (因此 容易 出 错 ) 。 我 们 将 代码 长 度 增 加 了 三 倍 ,并且 还 不 得 不 去 了 解 framed_area( ) 的 
实现 细节 。 但 是 我 们 仍然 没有 达到 目的 , 应 该 有 更 好 的 办 法 解决 这 一 问题 ! 

再 看 看 原始 代码 : 


int area2 = framed._ area(1,2); 
int area3 = framed_area(y'z); 


这 段 代码 也 许 会 出 错 , 但 我 们 至 少 知道 它 要 做 什么 。 如 果 把 错误 检查 移 到 framed_area( ) 内 
部 ,我们 可 以 保留 这 段 代码 。 
5. 5.2 被 调用 者 处 理 错 误 

在 framed_area( ) 内 部 实现 错误 检查 非常 简单 ，error( ) 仍然 可 以 被 用 于 错误 报告 : 


int framed area(int x, inty) /calculate area within frame 


{ 
const int frame_width = 2; 
if (x—frame_width<=0 || y-frame_width<=0) 
error("non-positive area() argument calied by framed_area()"); 
return area(x—frame_width,y~frame_width); 
} 


这 一 实现 非常 好 , 而 且 我 们 也 不 用 为 每 一 个 framed_area( ) 调 用 写 测试 。 在 一 个 大 程序 中 , 对 一 个 
会 被 调用 500 次 的 常用 函数 来 说 ,这 一 点 非常 有 用 。 而 且 , 如 果 和 需要 对 错误 处 理 进行 修改 的 话 ， 
我 们 只 需要 在 一 个 地 方 进行 改动 就 可 以 了 。 

需要 注意 的 是 , 在 这 里 我 们 很 自然 地 从 “调用 者 必须 检查 参数 ”的 方法 转变 到 “ 函数 必须 检查 
目 己 的 参数 ”的 方法 (也 称 为 “被 调用 者 检查 ”) 。 后 者 的 好 处 在 于 参数 检查 只 在 一 个 地 方 实现 。 我 
们 不 需要 在 整个 程序 中 查找 调用 点 。 而 且 , 参数 检查 只 在 一 个 地 方 实现 , 我 们 可 以 方便 地 掌握 参 
数 检查 的 全 部 信息 。 

让 我 们 把 这 一 思想 应 用 到 area( ) 中 : 


int area(int length, int width) ~ // calculate area of a rectangle 


if (length<=0 | width <=0) error("non-positive area() argument'"); 
return length*width; 
} 


上 面 程序 实现 了 对 于 area( ) 调 用 的 所 有 错误 处 理 , 因 此 我 们 不 再 需要 调用 framed_area( ) 。 进 一 步 
改进 , 我 们 可 能 需要 对 于 错误 信息 的 更 准确 描述 。 

函数 的 参数 检查 看 上 去 很 简单 , 但 是 为 什么 很 多 人 还 会 忽视 它 呢 ? 不 注意 错误 处 理 是 一 个 原 
因 , 粗心 大 意 是 另 一 个 原因 。 此 外 , 还 有 许多 其 他 因素 : 

e。 我 们 不 能 改变 函数 定义 : 在 函数 库 内 定义 的 函数 因 某 种 原因 不 能 被 改变 。 原 因 可 能 是 该 
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是 数 也 被 其 他 程序 调用 , 相关 的 错误 处 理 可 能 不 一 致 。 也 可 能 是 该 函数 为 其 他 人 所 有 ，, 你 
没有 相关 源 代码 。 也 可 能 是 该 函数 属于 某 一 个 会 定期 更 新 的 库 , 如果 你 修改 了 原 函 数 , 那 
么 当 库 更 新 时 , 你 不 得 不 再 次 修订 它 。 
。 被 调 函 数 不 知道 应 该 如 何 处 理 错误 : 这 是 库 盟 数 的 典型 应 用 。 库 的 作者 可 以 检测 到 错误 ， 
但 是 只 有 你 才 知 道 应 该 如 何 处 理 错误 。 
。 被 调 函 数 不 知 道 它 是 在 哪里 被 调用 的 : 当 你 获得 一 个 错误 信息 后 , 它 会 告诉 你 某 个 错误 发 
生 了 , 但 不 会 告诉 你 程序 是 如 何 执行 到 这 个 点 上 的 。 但 有 时 候 , 你 会 需要 更 详细 地 了 解 错 
误 信 息 。 
。 性 能 : 对 于 小 函数 来 说 , 错误 检查 的 代价 可 能 会 超过 计算 本 身 。 例 如 , 对 于 area( ) 函数 来 
说 , 错误 检查 代价 超过 函数 本 身 两 倍 (这 里 指 的 是 需要 执行 的 机 器 指令 的 数量 ， 而 不 是 源 
代码 长 度 )。 对 某 些 程序 来 说 , 这 很 重要 , 特别 是 当 es A 的 时 候 , 相关 的 参 
数 变 化 不 大 , 但 是 参数 检查 会 被 反复 执行 。 
那 我 们 应 该 怎么 做 呢 ? 除非 你 有 足够 的 理由 , 否则 参数 检查 还 是 应 该 在 函数 内 部 完成 。 
在 介绍 一 些 相 关内 容 后 , 我 们 将 在 5. 10 节 中 继续 讨论 如 何 处 理 错误 参数 的 问题 。 
5. 5.3 ”报告 错误 
让 我 们 考虑 另外 一 个 问题 : 在 检查 一 系列 参数 后 , 一 旦 发 现 了 错误 , 你 应 该 如 何 做 ? 有 时 ， 
你 可 以 返回 一 个 “错误 值 ”, 例如 : 
/ ask user for a yes-or-no answer; 
// return ‘'b' to indicate a bad answer (i.e., not yes or no) 


char ask_user(string question) 

{ 
cout << question << "? (yes or no)\n"; 
string answer = " "; 
cin >> answer; 
if (answer =="y" || answer=="yes") return 'y'; 
if (answer =="n" j| answer=="no") return 'n'; 
return'b'’;  //'b’ for “bad answer” 


} 


// calculate area of a rectangle; 

// return —1 to indicate a bad argument 

int areal(int length, int width) 

{ 
if (length<=0 || width <=0) return -1; 
return length*width; 

} 


如 上 面 示例 所 示 , 我 们 可 以 让 被 调 函 数 进行 详细 检查 ,同时 让 调用 者 按 需 要 处 理 错误 。 看 上 去 这 
种 方法 是 可 行 的 , 但 在 某 些 情况 下 , 这 种 方法 会 带 来 很 多 问题 使 得 它 实际 上 不 能 被 接受 : 

。 所 有 调用 者 和 被 调 函 数 都 需要 进行 错误 检查 。 调 用 者 要 进行 的 检查 可 能 很 简单 , 但 还 必 
须要 编写 这 段 代码 , 并 决定 在 错误 发 生 时 如 何 进 行 处 理 。 

。 调用 者 可 能 会 忘记 做 错误 检查 。 这 可 能 导致 程序 在 运行 时 出 现 不 可 预测 的 问题 。 

。 许 多 函数 并 没有 可 以 用 作 标 记 错 误 信 息 的 额外 返回 值 。 例 如 , 一 个 用 于 从 输入 设备 读 人 
整数 的 函数 (例如 cin 的 操作 符 >> ) ,其 返回 值 可 以 是 任意 整数 ,因此 不 能 用 一 个 专门 的 
整数 来 表示 错误 信息 。 

上 面 程序 中 的 第 二 种 情况 显示 的 就 是 调用 者 忘记 了 进行 测试 , 这 会 导致 某 些 不 可 预见 的 问题 ， 
例如 : 


int flint x, int y int z) 


int areal = area(x,y); 

if (area1<=0) error("non-positive area"); 
int area2 = framed area(1,z); 

int area3 = framed_area(yz); 

double ratio = double(areal)/area3; 

/1 ..， 


} 
你 看 出 错误 在 哪里 了 吗 ? 问题 就 是 缺少 了 错误 检查 。 因 为 没有 明显 的 错误 代码 , 这 类 错误 往往 很 
难 被 发 现 。 


试 一 试 ”测试 程序 的 不 同 输入 和 返回 值 。 输 出 函数 areal 、area2、area3 和 ratio 的 值 。 
尝试 插入 各 种 测试 程序 直到 所 有 错误 都 被 检测 到 。 如 何 才 能 知道 所 有 错误 都 被 找到 了 
呢 ? 这 不 是 一 个 脑筋 急 转 弯 问 题 , 在 本 例 中 , 你 可 以 通过 输入 有 效 的 参数 检测 所 有 的 
销 误 。 


还 有 另外 一 种 解决 这 一 问题 的 方法 : 使 用 异常 处 理 。 


5.6 异常 


与 大 多 数 现代 编程 语言 类 似 , C++ 也 提供 了 一 种 错误 处 理 机 制 : 异常 。 为 了 保证 检测 到 的 错 
误 不 会 被 遗漏 ， 蜡 稼 处 理 的 基本 思想 是 把 错误 检测 (在 被 调 函 数 中 完成 ) 和 错误 处 理 ( 在 主 调 函 数 
中 完成 ) 分 离 。 异 常 提 供 了 一 条 可 以 把 各 种 最 好 的 错误 处 理 方法 组 合 在 一 起 的 途径 。 错 误 处 理 很 
繁琐, 但 异常 可 以 让 它 变 得 简单 一 些 。 

异常 的 基本 思想 是 : 如 果 函 数 发 现 一 个 自己 不 能 处 理 的 错误 , 它 不 是 正常 返回 , 而 是 抛 
出 异常 来 表示 错误 的 发 生 。 任 何 一 个 直接 或 间接 的 函数 调用 者 都 可 以 捕捉 到 这 一 异常 , 并 
确定 应 该 如 何 处 理 。 消 数 可 以 用 try 语句 (细节 情况 将 在 后 面 小 节 中 介绍 ) 来 处 理 异常 : 把 所 
要 处 理 的 异常 情 帝 罗列 在 catch 语句 后 。 如 果 出 现 一 个 没有 被 任何 调用 函数 处 理 的 异常 ,， 程 
序 终 止 运行 。 

在 后 续 章 节 中 (参见 第 19 章 ) , 我 们 还 将 介绍 异常 的 一 些 高 级 用 法 。 
5. 6. 1 错误 参数 

下 面 是 函数 area( ) 使 用 异常 处 理 的 版 本 : 


class Bad area{};  //a type specifically for reporting errors from areal() 


// calculate area of a rectangle; 
// throw a Bad_area exception in case of a bad argument 
int areal(int length, int width) 


if (length<=0 || width<=0) throw Bad_area(); 
return length*width; 
} 


如 果 参 数 正确 , 我 们 会 返回 计算 的 面积 ; 否则 结束 函数 area( ) , 并 抛 出 异常 , 希望 这 个 异常 能 够 
被 捕获 并 做 出 相应 错误 处 理 。Bad_area 是 我 们 定义 的 一 个 新 类 型 。 它 的 目的 是 作为 函数 area( ) 中 
异常 的 标识 , 以 便 被 捕获 时 能 够 确认 异常 来 自 哪里 。 用 户 自 定义 类 型 (类 和 枚 举 ) 将 在 第 9 章 讨论 。 
需要 注意 的 是 ,Bad_area( ) 表 示 “ 定 义 一 个 名 为 Bad_area 类 型 的 对 象 "。 因 此 ,throw Bad_area( ) 表 示 
“定义 一 个 名 为 Bad_area 类 型 的 对 象 并 抛 出 它 ”。 

现在 我 们 可 以 这 样 写 : 


84 锚 一 部 分 基 杰 知 砍 


int main() 
try { 
int x = —11; 
inty = 2; 
intz = 4; 
1... 
int area1 = area(x,y); 
int area2 = framed_area(1,z); 
int area3 = framed_areal(y,2); 
double ratio = areal/area3; 
} 
catch (Bad area) { 
cout << "Oops! bad arguments to area)\n"; 
} 


首先 要 注意 的 是 , 上 面 的 错误 处 理 针对 的 是 所 有 对 area( ) 的 调用 , 包括 主 函数 里 的 一 个 调用 和 两 
个 通过 framed_area( ) 的 间接 调用 。 其 次 , 注意 如 何 处 理 错误 与 检测 错误 是 分 离 的 : main( ) 不 知道 
哪个 函数 做 了 throw Bad_area( ) 动作 ，area( ) 不 知道 哪个 函数 会 捕捉 它 所 抛 出 的 Bad_area 异常 。 
对 于 使 用 了 许多 库 的 大 程序 来 说 , 这 一 分 离 非 常 重要 。 因 为 在 编程 时 没有 人 希望 同时 对 应 用 程序 
和 库 代 码 进行 修改 , 所 以 没有 人 能 够 “通过 在 正确 位 置 简单 增加 几 行 代码 来 修正 错误 ”。 
5. 6.2 范围 绒 误 

大 多 数 实际 程序 都 需要 处 理 数据 集合 ,， 即 会 用 各 种 类 型 的 数据 表 、 队 列 等 来 完成 某 项 任务 。 在 
C++ 语言 中 , 我 们 一 般 把 “数据 集合 ” 称 为 容器 。 最 常用 的 标准 库容 器 是 4.6 节 介 绍 的 vector。 一 个 
vector 中 包含 一 组 数据 , 我 们 可 以 通过 vector 的 成 员 函 数 size( ) 来 获得 数据 的 个 数 。 如 果 我 们 引用 了 
一 个 不 在 有 效 范围 [0:v. size( ) ) 内 的 下 标 , 会 出 现 什 么 情况 
呢 ? 需要 注意 的 是 ,[low:high) 表 示 从 low 到 high -1 的 下 
标 范 围 , 它 包括 low 但 不 包括 high, 如 右 图 所 示 。 

在 回答 上 面 的 问题 前 , 我 们 先 看 看 另外 一 个 问题 和 它 的 答案 : 

“为 什么 要 这 么 做 呢 ?” 毕 竟 , 你 应 该 明白 下 标 只 能 在 范围 [0;v. size( ) ) 内 , 因此 确保 这 一 点 就 
可 以 了 呀 ! 
话 虽 然 是 这 么 说 的 , 但 是 实际 上 , 很 难保 证 这 种 情况 不 会 发 生 。 看 看 下 面 这 个 似乎 合理 的 程序 ; 


vector<int> v; /a vector of ints 

int i; 

while (cin>>i) v.push_back(i); /get values 

for (int i = 0; i<=v.size(); ++i) / print values 
cout << "Vv[' << i<<"] == "<<v[i] << endl; 


你 看 出 问题 了 吗 ? 试 着 把 它 标识 出 来 。 这 不 是 一 个 一 般 性 的 错误 。 这 种 错误 往往 是 由 我 们 自身 的 
原因 导致 的 , 特别 是 在 工作 到 很 晚 我 们 很 累 的 时 候 。 当 我 们 很 劳累 或 者 很 繁忙 的 时 候 , 这 类 错误 
经 常会 出 现 。 在 我 们 对 v[ ij 进行 操作 时 候 , 我 们 用 0 和 size( ) 来 保证 i 总 是 在 合法 的 范围 内 。 

不 幸 的 是 , 我 们 犯 了 一 个 错误 。 仔 细 看 看 for 循环 : 它 的 终止 条 件 是 i< = v. size( ) 而 不 是 i < 
v. size( ) 。 这 会 导致 一 个 不 幸 的 结果 : 如 果 我 们 读 人 了 5 个 整数 , 它 会 输出 6 个 结果 。 因 为 我 们 试 
图 读 v[5] 的 值 , 而 它 已 经 超出 了 vector 的 存储 空间 范围 。 这 类 错误 是 非常 普遍 的 而 且 很 “出 名 ”， 
人 们 为 它 起 了 很 多 名 字 : 偏 一 位 错误 (off-by-one error); 范围 错误 (range error) , 因为 下 标 不 在 vec- 
tor 的 合法 值 范围 内 ; 边界 错误 (bounds eror) ， 因 为 下 标 不 在 vector 的 合法 值 范围 内 。 

下 面 是 一 个 具有 同样 问题 的 简单 版 本 : 


vector<int> v(5); 
int x = v[5]; 
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然而 , 我 们 还 是 怀疑 你 没有 认识 到 这 个 问题 的 真实 性 和 严重 性 。 

当 我 们 犯 了 这 个 错误 后 , 实际 会 发 生 什么 情况 呢 ?vector 的 下 标 操作 知道 元 素 的 个 数 , 因此 
它 可 以 检测 是 否 出 错 (我 们 所 使 用 的 vector 也 是 可 以 的 , 参见 4.6 节 和 19.4 节 )- 如 果 检 查 到 错 
误 , 下 标 操作 将 抛 出 一 个 名 为 out_of_range 的 异常 。 因 此 , 如 果 程序 的 代码 有 范围 错误 并 导致 了 
异常 的 话 , 我 们 至 少 能 够 捕捉 到 一 个 异常 信息 。 


int main() 
try { 
vector<int> v， /a vector of ints 
int xs 
while (cin>>x) v.push_back(x); // set values 
for (int i = 0; i<=v.size(); ++i) I print values 


cout << "v[" <<i<<"] =="<<v[i] << endl; 
} catch (out_of_range ){ 
Cerr << "Oops! Range errorn"; 


return 1; 

} catch (...) { I catch all other exceptions 
cerr << "Exception: something went wrong\n"; 
return 2; 


} 
需要 注意 的 是 , 范围 错误 可 以 被 认为 是 5.5.2 节 中 提 到 的 参数 错误 的 一 个 特例 。 我 们 不 能 保证 自 
己 对 向 量 下 标的 范围 检查 总 是 正确 的 , 因此 我 们 让 向 量 的 下 标 操 作 来 做 这 一 检查 。 正 如 上 文 所 
述 , 问 量 的 下 标 函 数 ( 名 为 vector :: operator[ ] ) 能够 通过 抛 出 异常 来 报告 错误 。 它 还 能 做 什么 呢 ? 
如 果 发 生 一 个 范围 错误 , 它 是 不 知道 我 们 将 会 如 何 处 理 的 。 向 量 的 编写 者 甚至 不 知道 向 量 是 属于 
程序 的 哪 一 段 代码 。 
5. 6. 3 输入 错误 

我 们 将 把 处 理 输入 错误 的 细节 讨论 放 到 10. 6 节 。 不 过 , 一 旦 输入 错误 被 发 现 , 利用 与 处 理 参 
数 错误 和 范围 错误 相同 的 技术 , 它 将 会 币 迅 速 处 理 。 这 里 , 我 们 只 展示 如 何 判 断 输 入 是 否 正确 ， 
下 面 是 输入 一 个 浮 点 数 的 情况 : 

double d = 0; 

cin >> d; 
通过 测试 cin, 我 们 可 以 确定 最 后 一 个 输入 操作 是 否 成 功 : 

ge is well, and we can try reading again 

chet 

I the last read didn't succeed, so we take some other action 


} 
有 几 种 原因 可 能 会 导致 输入 操作 失败 。 其 中 一 个 原因 就 是 > 操作 输入 的 不 是 所 要 求 的 double 类 
型 数据 。 

在 开发 工作 的 早期 , 我 们 主要 关注 于 发 现 错误 但 并 没有 给 出 特别 好 的 办 法 来 解决 它 。 我 们 做 
的 仅仅 是 报告 错误 并 终止 程序 。 下 面 , 我 们 将 尝试 更 好 的 办 法 来 处 理 它 。 例 如 : 


double some function() 
{ 
double d = 0; 
cin >> d; 
if (lcin) error("couldn't read a double in 'some_function()' "); 
I do something useful 
} 


传递 给 函数 error( ) 的 字符 串 将 被 输出 , 它 可 以 作为 调试 的 有 益 帮 助 或 反馈 给 用 户 的 信息 。 这 个 对 
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于 很 多 程序 都 很 有 用 的 error( ) 应 该 如 何 编写 呢 ? 因为 我 们 不 知道 应 该 如 何 处 理 返回 值 , 所 以 这 个 
旺 数 没有 返回 值 , 它 在 输出 信息 后 将 直接 终止 程序 。 此 外 , 在 终止 程序 前 , 我 们 可 以 做 一 些 次 要 
的 操作 , 例如 保持 窗口 一 段 足 够 长 的 时 间 以 便 我 们 阅读 信息 。 显 然 , 这 是 异常 处 理应 该 做 的 工作 
(参见 7.3 节 ) 

标准 库 定 义 了 一 些 异 常 , 例如 vector 的 out_of_range。 此 外 , 标准 库 还 提供 runtime_error 异常 。 
runtime_error 对 我 们 非常 有 用 ,因为 它 包含 一 个 字符 串 , 可 以 用 于 错误 处 理 。 有 了 它 , error( ) 可 以 
写成 下 面 的 形式 : 


void error(string s) 
{ 
throw runtime_error(s); 


} 
当 我 们 想 处 理 runtime_error 的 时 候 , 我 们 捕 提 到 它 就 可 以 了 。 对 于 简单 程序 来 说 , 在 main( ) 中 捕 
提 runtime_error 更 理想 ; 


int main() 
try { 
// our program 
return 0; I 0 indicates success 
} 
catch (runtime_error& e) { 
cerr << "runtime error: " << e.what() << \n'; 
keep_window_open(); 
return 1; /1indicates failure 


} 
对 e. what( ) 的 调用 将 从 runtime_error 中 提取 错误 信息 。 在 下 面 语句 


catch(runtime_error& e) { 
中 的 & 表 示 我 们 希望 “以 引用 方式 传递 异常 ”。 现 在 , 我 们 暂时 把 它 看 做 一 种 不 相关 的 技术 。 在 
8. 5.4 节 ~8.5.6 节 中 , 我 们 会 详细 解释 通过 引用 传递 参数 的 含义 。 

注意 , 这 里 我 们 使 用 cerr 而 不 是 cout 进行 错误 信息 输出 : cerr 与 cout 用 法 相同 , 只 是 它 
是 专门 用 于 错误 信息 输出 的 。 默 认 情 况 下 ，cerr 和 cout 都 输出 到 屏幕 上 , 但 是 cerr 没有 经 过 
优化 , 所 以 更 适合 错误 信息 输出 , 在 一 些 操作 系统 中 它 还 可 以 被 转 到 其 他 输出 目标 , 例如 一 
个 文件 中 。 使 用 cerr 也 有 助 于 我 们 编写 与 错误 相关 的 文档 ,因此 , 我 们 使 用 cerr 作为 错误 信 
息 输出 。 

显然 , out_of _range 与 runtime_error 不 同 。 当 捕获 到 runtime_error 异常 时 候 , 错误 处 理 方式 不 
会 像 处 理 out_of _range( 向 量 或 者 其 他 标准 库容 器 导致 的 ) 那 样 。 但 是 , out_of_range 与 runtime_error 
都 是 “异常 ”, 我 们 可 以 对 异常 进行 一 些 通用 的 处 理 : 


int main() 
try{ 
// our program 
return 0; /0 indicates success 
} 
catch (exception& e) { 
Cerr << "error: " << e.what() << \n'; 
keep_window_open(); 
return 1; // 1 indicates failure 
} 
catch (...) { 
cerr << "Oops: unknown exception!\n"; 
keep_window_open(); 
return 2; /2 indicates failure 


这 里 我 们 加 上 catch(…) 来 处 理 任 何其 他 类 型 的 异常 。 

我 们 用 来 同时 处 理 out_of_range 与 mntime_error 两 种 异常 的 是 一 个 单一 类 型 exception ， 它 称 为 
两 者 的 公共 基 类 ( 超 类 型 ，supertype) 。 这 是 一 种 非常 有 用 的 通用 技术 , 我 们 将 在 第 13 章 ~ 第 16 
章 中 详细 介绍 。 

需要 注意 的 是 ,main( ) 的 返回 值 传递 给 了 调用 程序 的 “系统 。 一 些 系统 (例如 UNIX) 经 常会 
用 到 这 些 返 回 值 , 而 男 一 些 系统 (例如 Windows) 会 忽略 它们 。 返 回 值 为 0 表示 main( ) 成 功 完成 ， 
而 非 0 返回 值 表 示 某 些 错误 发 生 了 。 

在 使 用 error( ) 的 时 候 , 你 可 能 希望 能 同时 传递 两 部 分 信息 来 描述 所 发 生 的 问题 。 在 这 种 情况 
下 , 我 们 可 以 把 这 两 部 分 信息 连接 起 来 作为 一 个 字符 串 传递 。 因 此 , 我 们 提供 了 第 二 个 版 本 的 


error( ) : 


void error(string s1, string s2) 
{ 


throw runtime_error(s1+s2); 


在 我 们 的 需求 极 大 提高 ,以 及 我 们 作为 设计 师 和 程序 员 的 水 平 相应 提高 之 前 , 这 种 简单 的 错误 处 
理 方式 就 够 用 了 。 需 要 注意 的 是 ，error( ) 的 使 用 与 程序 执行 路 径 上 有 多 少 函 数 调用 是 无 关 的 : 
error( ) 会 查找 距离 最 近 的 捕获 mntime_error 的 操作 ,这 个 操作 通常 就 在 main( ) 中 。 使 用 异常 和 
error( ) 的 例子 , 可 以 参考 7.3 节 和 7.7 节 的 内 容 。 如 果 某 个 异常 没有 被 捕获 到 ， 默 认 情 况 下 , 你 
会 得 到 一 个 系统 错误 (“未 捕获 异常 ”错误 ) 。 
试 一 试 ”尝试 看 看 未 捕获 异常 错误 会 是 什么 样 : 运行 一 个 使 用 了 error( ) 而 没有 捕获 

任何 异常 的 小 程序 。 
5. 6.4 截断 错误 

在 3. 9.2 节 中 , 我 们 曾 看 过 一 个 故意 的 错误 : 当 我 们 给 一 个 变量 赋 了 一 个 “ 太 大 ”的 值 后 , 这 
个 值 会 被 截断 。 例 如 : 


int x = 2.9; 
char c = 1066; 


这 里 x 的 值 是 2 而 不 是 2.9, 因为 x 是 整 型 , 而 整 型 没有 小 数 部 分 只 有 整数 部 分 (这 是 显然 的 ) 。 
类 似 地 ， 如 果 我 们 使 用 ASCII 字符 集 , c 的 值 将 是 42( 表示 字符 * ) , 而 不 是 1066 ,因为 字符 集中 
没有 值 为 1066 的 字符 。 

在 3.9.2 节 中 , 我 们 已 经 看 到 如 何 通 过 测试 来 确保 截断 错误 不 发 生 。 有 了 异常 (和 模板 , 参见 
19. 3 节 ), 我 们 可 以 编写 函数 来 测试 能 够 引起 值 改变 的 赋值 或 初始 化 操作 , 有 错误 发 生 时 , 抛 出 
rintime_error 异常 。 例 如 : 


int xf = narrow_cast<int>(2.9); // throws 
int x2 = narrow_cast<int>(2.0); /OK 
char cf = narrow_cast<char>(1066);  //throws 
char c2 = narrow_cast<char>(85); lOK 


这 里 <… > 的 用 法 与 vector < int > 中 的 尖 括 号 相同 。 当 和 需 用 确定 一 个 类 型 而 不 是 数值 时 ,我们 可 
以 这 样 使 用 。 它 们 被 称 为 模板 参数 。 当 需要 进行 类 型 转换 而 不 确定 数值 “是 否 适合 ”目标 类 型 时 ， 
我 们 可 以 使 用 narrow_cast。 它 是 在 std_lib_facilities. h 中 定义 并 用 error( ) 实现 的 。 单 词 cast 的 意思 
是 “类 型 转换 ”,， 它 暗示 进行 转换 的 对 象 是 有 问题 的 (就 像 对 一 条 疡 腿 固定 石膏 模 一 样 ) 。 需 要 注 
意 的 是 , 类 型 转换 并 不 会 改变 操作 数 , 而 是 生成 了 一 个 与 其 操作 数 对 应 的 新 数值 ,其 类 型 在 
<… > 中 指明 。 
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5.7 ”逻辑 错误 


在 解决 了 开始 的 编译 器 和 连接 器 错误 后 , 程序 就 能 运行 了 。 通 常情 况 下 , 此 时 的 程序 要 么 没 
有 输出 要 么 输出 结果 是 错误 的 。 产 生 这 样 结果 的 原因 有 很 多 , 具体 原因 可 能 是 你 所 理解 的 程序 逻 
辑 是 错误 的 ; 可 能 你 所 编写 的 程序 并 不 是 你 所 设想 的 ; 可 能 你 写 控制 语句 时 犯 了 “低级 错误 ”; 或 
者 其 他 原因 。 通 常 ， 逻辑 错误 是 最 难 被 发 现 和 排除 的 , 因为 在 这 种 情况 下 计算 机 所 做 的 正 是 你 让 
它 做 的 事情 。 你 此 时 的 任务 是 要 发 现 你 让 计算 机 所 做 的 事情 为 什么 没有 反映 你 的 真实 意愿 。 基 
本 上 ，, 我 们 可 以 认为 计算 机 是 一 个 速度 非常 快 的 笨蛋 。 它 只 是 精确 地 完成 你 让 它 做 的 事情 , 这 一 
点 有 时 会 让 人 感到 很 获 坎 。 

让 我 们 通过 一 个 简单 的 例子 来 理解 逻辑 错误 。 下 面 的 代码 在 一 组 数据 中 找 出 最 低 、 最 高 和 平 
均 温度 : 

int main() 

. vector<double> temps; /temperatures 


double temp = 0; 
double sum = 0; 
double high_temp = 0; 
double low_temp = 0; 


while (cin>>temp) // read and put into temps 
temps.push._back(temp); 


for (int i = 0; i<temps.size(); ++i) 

{ 
if(temps[i] > high_temp) high_temp = temps[i]; /find high 
if(temps[i] <low_temp) low. temp =tempslil; /find iow 
sum += temps[i]; lH compute sum 


} 


cout << "High temperature: " << high_temp<< endl; 
cout << "Low temperature: " << low_temp << endl; 
cout << "Average temperature: " << sum/temps.size() << endl; 


} 
为 了 测试 上 述 程序 , 我 们 输入 2004 年 2 月 16 日 得 克 萨 斯 州 拉 伯 克 (Lubbock ) 气 象 中 心 测 得 的 每 
小 时 温度 值 (得 克 萨 斯 州 使 用 的 是 华氏 温度 ) 。 


-1 6.5, -23.2, -24.0, 一 25.7， 一 26.1 -1 8.6, -9.7, -2.4, 
7.5, 12.6, 23.8, 25.3, 28.0, 34.8， 36.7, 41.5， 
40.3, 42.6, 39.7, 35.4, 12.6, 6.5, -3.7， -14.3 
输出 是 : 
High temperature: 42.6 


Low temperature: —26.1 
Average temperature: 9.3 


初学 者 会 认为 上 面 的 程序 是 没有 问题 的 ,不 负责 的 程序 员 会 把 它 直接 交付 用 户 。 遵 愤 的 做 法 应 该 


是 用 另外 一 组 数据 再 次 测试 程序 , 这 组 数据 来 自 2004 年 7 月 23 日 。 


76.5, 73.5， 71.0, 73.6, 70.1, 73.5, 77.6, 85.3, 
88.5, 91.7, 95.9, 99.2， 98.2, 100.6， 106.3， 112.4, 
110.2, 103.6， 94.9， 91.7, 88.4, 85.2, 85.4, 87.7 


这 一 次 , 输出 结果 是 : 
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High temperature: 112.4 
Low temperature: 0.0 
Average temperature: 89.2 


哦 , 一 定 是 什么 地 方 出 问题 了 。7 月 份 的 拉 伯 克 出 现 严寒 (0.0 华氏 度 大 约 是 零下 18 摄氏 度 ) 将 意 
味 着 世界 末日 ! 你 能 找 出 错误 在 哪里 吗 ? 原因 在 于 low_temp 的 初 值 是 0.0, 除非 有 一 个 温度 值 低 
于 0.0, 否则 它 将 一 直 是 0. 0。 
试 一 试 ”运行 上 面 的 程序 , 检验 一 下 输入 数据 确实 会 产生 那样 的 结果 。 尝 试 一 下 利 
2 打破 ”程序 ( 即 令 程 序 输出 错误 结果 )。 看 看 你 需要 输入 多 少 组 数据 ， 
会 令 程 序 出 错 ? 
ee. 程序 中 还 有 其 他 错误 。 如 果 所 有 温度 值 都 低 于 0 的 话 ， 会 发 生 什么 ? high_temp 的 初始 
化 与 low_temp 存在 同样 的 问题 : 除非 有 一 个 温度 值 高 于 0.0, 否则 high_temp 将 始终 是 0.0。 在 南 
极 , 这 个 程序 同样 会 出 现 问 题 。 
这 类 错误 是 相当 典型 的 , 在 程序 编译 的 时 候 它 不 会 出 错 , 对 于 “合理 的 ”输入 也 不 会 出 错 。 但 
是 , 我 们 亚 记 了 仔细 思考 应 该 将 哪些 数据 定义 为 ” 合理 的 ” 。 这 个 程序 的 改进 如 下 : 


int main() 

{ 
doubie temp =0; 
double sum = 0; 
double high_temp =—1000; Vinitialize to impossibly low 
double low_temp = 1000; // initialize to “impossibly high” 
int no_of temps = 0; 


while (cin>>temp) { // read temp 
++no_of_temps; // count temperatures 
sum += temp; /compute sum 
if (temp > high. temp) high_temp = temp; /find high 
if (temp < low_temp) low_temp = temp; I find low 


} 


cout << "High temperature: " << high_temp<< endl; 

cout << "Low temperature: " << low_temp << endl; 

cout << "Average temperature: " << sum/no_of_ temps << endl; 
} 


这 个 程序 正确 吗 ? 你 如 何 确定 ?你 应 该 如 何 准确 定义 程序 的 “正确 性 ”? 哪里 的 温度 值 会 达到 
1000 和 一 1000 呢 ? 想 一 想 关 于 “ 麻 数 ”的 警告 ( 见 5.5.1 节 )。 程 序 中 使 用 1000 和 -1000 这 样 的 
文字 常量 不 是 一 种 好 的 编程 风格 , 但 这 两 个 值 也 会 有 问题 吗 ? 是 否 有 哪个 地 方 的 温度 会 低 于 华氏 
~1000 度 ( -573 摄氏 度 ) 呢 ?是 否 有 哪个 地 方 的 温度 会 高 于 1000 华氏 度 (538 摄氏 度 ) 呢 ? 
试 一 试 查阅 一 下 相关 资料 ,为 我 们 程序 的 min_temp(“ 最 低温 度 ”) 和 max_temp 
(“最 高 温度 ”) 设 定 合适 的 常量 值 。 这 些 常 量 将 决定 我 们 程序 的 适用 范围 。 


5.8 估计 


想象 一 下 , 你 已 经 编写 了 一 个 进行 简单 计算 的 程序 , 例如 计算 六 边 形 面积 。 运 行 这 个 程序 你 
得 到 的 结果 是 ~ 34. 56。 你 知道 它 肯定 有 问题 , 为 什么 ?因为 面积 不 可 能 是 负数 。 接 下 来 , 你 找到 
并 修改 了 相应 错误 (不 管 它 是 什么 ) , 然后 再 次 得 到 一 个 结果 21. 65685。 这 一 次 对 了 吗 ? 很 难说 ， 
因为 我 们 一 般 不 能 马上 说 出 计算 六 边 形 面积 的 公式 。 为 了 避免 将 一 个 产生 可 笑 结果 的 程序 交付 
用 户 而 使 我 们 出 丑 , 我 们 应 该 在 交付 之 前 检查 程序 结果 是 否 合理 。 在 本 例 中 , 这 个 工作 很 简单 。 
六 边 形 与 正方 形 很 接近 , 在 纸 上 天 一 个 六 边 形 , 目测 一 下 , 它 接近 一 个 3 乘 3 的 正方 形 , 这 样 的 一 
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个 正方 形 的 面积 是 9。 真 倒霉 , 结果 21. 65685 不 可 能 是 对 的 。 因 此 我 们 继续 修改 程序 , 新 程序 的 
计算 结果 为 10. 3923。 这 一 次 , 它 可 能 是 正确 的 了 1 

这 种 方法 与 六 边 形 无 关 , 其 关键 思想 是 , 除非 我 们 知道 正确 的 结果 大 概 是 什么 , 或 者 与 什么 
比较 类 似 , 否则 我 们 不 能 判定 得 到 的 结果 是 否 合理 。 要 不 断 问 自己 如 下 问题 : 

1) 这 个 问题 的 答案 合理 吗 ? 
还 应 该 问 一 个 更 一 般 的 (通常 也 更 难 的 ) 问题 

2) 我 们 应 该 如 何 判定 一 个 结果 是 否 合理 ? 
这 里 , 我 们 没有 问 “ 最 准确 的 答案 是 什么 ?” 或 “正确 答案 是 什么 ?” 这 是 我 们 编写 的 程序 要 告诉 我 
们 的 。 我 们 所 要 知道 的 就 是 这 个 答案 是 合理 的 。 只 有 确定 了 结果 的 合理 性 后 , 我 们 才能 做 下 一 步 
工作 。 

估计 (estimation ) 是 一 种 优雅 的 艺术 , 它 将 常识 与 一 些 用 来 解决 常见 问题 的 非常 简单 的 数学 方 
法 结合 起 来 。 一 些 人 很 擅长 在 头脑 中 估计 , 但 我 们 更 提倡 在 纸 上 随意 写 写 画 画 , 因为 这 种 方法 能 
够 帮助 我 们 减少 错误 。 我 们 这 里 所 说 的 估计 是 一 种 非 正式 的 技术 。 有 时 候 它 会 被 (幽默 地 ) 称 为 
瞎 估 计 (guesstimation) ,因为 它 是 将 一 点 猜测 和 一 点 计算 结合 起 来 的 方法 。 

试 一 试 ” 我 们 的 六 边 形 的 每 边 长 都 是 2 厘米 。 得 到 的 结果 是 正确 的 吗 ? 亲自 动手 

“在 信封 背面 " 算 一 下 。 在 纸 上 把 它 画 出 来 ,不 要 觉得 这 太 简单 了 。 许 多 著名 的 科学 家 都 

有 这 样 一 种 令 人 客 佩 的 能 力 : 用 笔 在 信封 背面 (或 餐巾 纸 上 ) 估 计 出 问题 的 近似 结果 。 这 

是 一 种 能 力 , 实际 上 也 是 一 种 简单 的 习惯 , 它 能 够 帮助 我 们 节省 很 多 时 间 并 减少 很 多 

错误 。 

通常 ,估计 的 过 程 包括 对 正确 计算 所 逢 输入 数据 的 估计 , 我 们 还 未 对 此 进行 过 讨论 。 假 定 我 
们 要 测试 一 个 估计 城市 间 驾 驶 时 间 的 程序 , 开车 从 纽约 到 丹佛 花费 15 小 时 或 33 分钟, 这 个 时 间 
是 否 合理 呢 ? 从 伦敦 到 尼斯 呢 ? 为 什么 合理 或 者 为 什么 不 合理 呢 ? 在 回答 这 些 问 题 时 , 你 需要 用 
什么 数据 来 估计 行车 时 间 呢 ? 通常 , 在 互联 网 上 快速 搜索 一 下 是 最 有 用 的 方法 。 例 如 ,2000 英里 
是 纽约 和 丹佛 之 间距 离 的 合理 估计 。 对 于 驾驶 汽车 来 说 , 保持 每 小 时 130 英里 的 平均 速度 是 很 困 
难 的 (或 者 是 非法 的 ) 。 因 此 15 小 时 的 结果 是 不 合理 的 (15 * 130 略 小 于 2000) 。 你 可 以 检验 一 
下 : 我 们 既 高 估 了 距离 , 也 高 估 了 平均 速度 , 但 在 检验 合理 性 时 , 我 们 不 需要 非常 准确 , 只 要 估计 
得 差不多 就 可 以 了 。 

试 一 试 ” 估 计 一 下 上 述 开车 时 间 。 同 时 ,也 估计 一 下 相应 的 飞行 时 间 ( 假 定 乘 坐 普 
通 的 民航 航班 )。 然 后 , 利用 更 准确 的 数据 来 验证 你 的 估计 , 例如 地 图 和 时 刻 表 。 我 们 
建议 使 用 互联 网 资源 。 


5.9 调试 


当 你 写 完 一 个 程序 后 , 它 会 有 不 少 错误 。 小 程序 偶尔 会 一 次 通过 , 但 如 果 一 个 复杂 的 大 程序 
也 出 现 这 种 情况 的 话 , 你 一 定 要 保持 一 个 非常 谨慎 的 态度 。 如 采 它 确实 第 一 次 运行 就 正确 的 话 ， 
赶紧 告诉 你 的 朋友 们 来 庆祝 一 下 吧 ， 因 为 这 种 事情 不 是 每 年 都 有 的 。 

因此 , 当 你 号 完 代 码 后 , 你 要 做 的 就 是 找到 并 排除 错误 。 这 一 过 程 称 为 调试 , 错误 被 称 为 
bug。 据 说 bug( 有 昆虫 的 意思 ) 一 词 来 自 于 早期 真空 管 计 算 机 时 代 , 那 时 的 计算 机 是 占据 了 很 大 
空间 的 真空 管 计算 机 ， 当 小 昆虫 进入 电路 板 后 就 会 导致 硬件 故障 。 一 些 人 将 bug 一 词 借用 过 来 专 
指 软 件 中 的 错误 , 其 中 最 著名 的 就 是 Grace Murray Hopper，COBOL 编程 语言 的 发 明 人 (参见 
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22. 2.2. 2 节 ) 。 这 个 词 第 一 次 出 现 已 经 是 五 十 多 年 以 前 的 事情 了 , 现在 它 已 经 被 大 们 普遍 接受 
查找 并 排 际 错误 的 过 程 称 为 调试 。 

调试 可 以 简单 地 描述 为 : 

1) 让 程序 编译 通过 。 

2) 让 程序 正确 连接 。 

3) 让 程序 完成 我 们 希望 它 做 的 工作 。 

基本 上 ,我们 要 一 次 次 重复 这 个 过 程 : 对 于 大 程序 , 需要 上 百 次 、 上 千 次 、 年 复 一 年 。 每 当 程 
序 不 能 正常 工作 , 我 们 就 要 找 出 问题 并 修正 。 我 认为 在 编程 中 调试 是 最 乏味 、 最 费时 间 的 工作 ， 
因此 应 该 不 遗 余力 地 做 好 设计 和 编码 工作 ,以 使 除 错 的 时 间 降 到 最 低 。 有 的 人 会 在 调试 过 程 中 体 
验 到 搜寻 bug 和 深入 程序 精 散 的 快乐 一 一 调试 可 以 和 视频 游戏 一 样 让 人 上 瘤 , 会 把 程序 员 没 日 没 
夜 地 黏 在 计算 机 前 (以 个 人 的 经 验 , 我 可 以 证 实 这 一 点 ) 。 

下 面 是 尽量 避免 调试 的 方法 : 

while (the program doesn'tappear to work) { //pseudo code 

Randomly look through the program for something that “looks odd” 


Change it to look better 
} 


为 什么 我 们 要 提 到 这 些 呢 ? 显然 , 糟糕 的 方法 会 使 成 功 的 机 会 变 得 很 低 。 不 幸 的 是 ， 上述 行为 恰 
好 概括 了 许多 人 在 深 更 半夜 工作 , 特别 是 毫 无 头绪 时 所 做 的 “无 用 功 ”。 
调试 中 的 关键 问题 是 : 
我 如 何 知道 程序 是 否 真正 运行 正确 呢 ? 
如 果 你 不 能 回答 这 个 问题 , 你 将 会 陷入 长 时 间 、 乏味 的 调试 工作 中 , 而 且 你 的 用 户 也 很 可 能 陷 人 
麻烦 。 我 们 会 反复 强调 这 个 问题 , 任何 有 助 于 回答 此 问题 的 信息 都 会 减少 调试 的 工作 量 , 并 有 助 
于 生成 正确 、 可 维护 的 程序 。 实 际 上 , 我 们 宁愿 程序 设计 良好 , 使 得 错误 无 处 藏身 。 一 般 来 说 这 
个 目标 很 难 达 到 , 但 我 们 还 是 会 在 程序 设计 上 下 功夫 , 以 最 小 化 出 错 的 概率 , 同时 最 大 化 发 现 错 
误 的 概率 。 
5. 9. 1 实用 调试 技术 
在 编写 代码 前 一 定 要 仔细 考虑 调试 问题 。 如 果 已 经 写 完 很 多 行 代码 之 后 你 才 想 到 应 该 如 何 
简化 调试 问题 的 话 , 那 就 太 晚 了 。 
首先 你 要 决定 如 何 报告 错误 :“ 使 用 error( ) 并 在 main( ) 中 捕获 异常 "应 该 是 你 从 本 书 学 到 的 
一 个 标准 答案 。 
要 提高 程序 的 易 读 性 , 这 样 你 会 有 更 多 机 会 发 现 错误 所 在 : 
。 为 代码 做 好 注释 。 这 并 不 意味 着 “加 上 大 量 注释 "。 能 靠 代 码 本 身 表达 清楚 的 , 不 要 用 注 
释 。 注 释 的 内 容 应 该 是 你 不 能 在 代码 里 说 清楚 的 部 分 。 你 应 该 用 尽量 简洁 、 清 楚 的 语言 
把 它们 说 清楚 以 下 内 容 : 
s 程序 的 名 称 
s 程序 的 目的 
= 谁 在 什么 时 候 写 了 这 个 代码 
a 版 本 号 
代码 的 每 部 分 的 目的 是 什么 
u 总 体 设 计 思 想 是 什么 
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s 源 代码 是 如 何 组 织 的 
= 输入 数据 的 前 提 假 设 是 什么 
= 还 缺少 哪 一 部 分 代码 , 程序 还 不 能 处 理 哪 些 情况 
使 用 有 意义 的 名 字 。 
。 这 并 不 意味 着 使 用 “长 名 字 ”。 
使 用 一 致 的 代码 层次 结构 。 
a 你 是 代码 的 负责 人 , 集成 调试 环境 (IDE) 可 以 帮助 但 不 能 替代 你 做 所 有 事情 。 
s 本 书 所 使 用 的 编程 风格 可 以 作为 一 个 有 益 的 起 点 。 
代码 应 该 被 分 成 许多 小 函数 ,每 个 函数 表达 一 个 逻辑 功能 。 
a 尽量 避免 超过 一 或 两 页 的 函数 ; 大 多 数 函 数 应 该 很 短 。 
避免 使 用 复杂 的 程序 语句 。 
= 尽量 避免 使 用 品 套 的 循环 、 髋 套 的 这 语句 、 复杂 的 条 件 等 。 不幸 的 是 , 有 时 你 必须 这 样 
做 , 但 请 记 住 复杂 代码 是 最 容易 隐藏 错误 的 地 方 。 
在 可 能 的 情况 下 , 使 用 标准 库 而 不 是 你 自己 的 代码 。 
s 同样 是 完成 某 个 功能 , 标准 库 一 般 会 比 你 自己 写 的 程序 考虑 得 更 周全 , 并 且 经 过 了 更 完 
备 的 测试 。 

上 面 的 描述 有 些 抽象 , 但 在 后 续 的 篇 幅 中 , 我 们 会 通过 一 个 个 的 例子 来 向 你 详细 解释 。 

程序 首先 要 编译 通过 。 在 这 个 阶段 , 编译 器 显然 是 你 最 好 的 助手 。 它 给 出 的 错误 信息 通常 是 
很 有 用 的 , 虽然 我 们 总 希望 得 到 更 准确 的 信息 , 除非 你 是 一 个 真正 的 专家 , 否则 你 还 是 假定 编译 
器 是 正确 的 为 好 。 如 果 你 是 一 个 真正 的 专家 , 这 本 书 不 是 为 你 写 的 。 有 时 , 你 会 觉得 编译 器 遵循 
的 规则 实在 是 太 愚 剧 而 且 没 有 必要 (通常 并 非 如 此 ) ,这些 规 则 能 够 而 且 应 该 更 简单 (的 确 , 但 是 
它们 不 是 这 样 的 ) 。 然 而 , 俗话 说 “糟糕 的 工匠 才 会 抱怨 他 的 工具 ”。 好 的 工匠 了 解 自己 的 工具 的 
长 处 和 短处 , 并 能 在 此 基础 上 对 自己 的 工作 进行 相应 调整 。 下 面 是 一 些 常见 的 编译 时 错误 : 

。 每 一 个 字符 串 常量 都 用 双 引 号 终止 了 吗 ? 


cout << "Hello, << name << n'; / oops! 
。 每 一 个 字符 常量 都 用 单 引 叶 终 止 了 吗 ? 

cout << "Helio, " << name << n; / oops! 
。 每 一 个 程序 块 都 终止 了 吗 ? 

int fint a) 


{ 
if (a>0) {/* do something */ else {/* do something else */} 
} / oops! 


。 所 有 圆 括号 都 一 对 一 匹配 吗 ? 
if (a<=0 / oops! 
x = f(y); 


编译 器 一 般 会 “ 稍 晚 些 ” 报 告 这 类 错误 ,因为 它 不 知道 你 本 来 想 在 0 之 后 输入 一 个 右 括号 。 
。 每 一 个 名 字 都 声明 了 吗 ? 

=” 你 是 否 包 含 了 所 有 必需 的 头 文件 (目前 , 应 该 用 者 nclude " std_lib_facilities. h" )? 

所 有 名 字 都 在 使 用 之 前 进行 声明 了 吗 ? 


a 你 是 否 拼 正 确 拼 写 了 所 有 名 字 ? 
int count; /*...*/++Count; Woopsi 


char ch;  /*...? Cin>>c; // double oops! 


你 用 分 号 终止 了 每 个 表达 式 语句 吗 ? 
x= Sqrt(y)+2 / oops! 
ZzZ= Xx+3; 


在 本 章 的 简单 练习 中 , 我 们 将 给 出 更 多 的 例子 。 同 时 , 请 记 住 5.2 节 中 提出 错误 的 分 类 。 

在 程序 的 编译 和 连接 完成 后 ， 下 一 步 就 是 最 难 的 部 分 了 : 找 出 程序 没有 按照 我 们 的 意图 去 运 
行 的 原因 。 你 要 检查 输出 结果 , 并 尽力 搞 清 楚 为 什么 程序 会 产生 这 样 的 结果 。 实 际 上 , 通常 首先 
你 会 看 着 一 个 黑屏 (或 窗口 ), 奇怪 于 你 的 程序 没有 输出 任何 结果 。 对 于 Windows 控制 台 程 序 , 通 
第 面临 的 第 一 个 问题 就 是 , 在 你 能 够 看 清楚 输出 结果 之 前 ( 如果 有 的 话 )， 控 制 台 窗 口 就 消失 了 。 
一 种 解决 办 法 是 在 aint ) 的 末尾 调用 std_lib_facilities. h 中 的 keep_window_open( )。 这 样 , 窗口 在 
退出 前 会 等 待 一 个 输入 。 在 给 出 一 个 输入 关闭 窗口 之 前 , 你 就 可 以 查看 输出 结果 了 。 

在 查找 错误 时 , 你 要 从 程序 中 最 后 一 个 能 够 确认 正确 的 语句 开始 , 逐条 语句 仔细 检查 ,就 好 
像 你 就 是 计算 机 在 执行 这 个 程序 。 程 序 的 输出 是 否 与 你 的 预计 相同 呢 ? 当然 是 不 会 了 , 如果 是 的 
话 , 你 就 不 用 调试 了 。 


通常 ， 当 你 没有 找到 问题 的 时 候 , 原因 是 你 只 “看 到 ”了 自己 希望 看 到 的 , 而 不 是 你 编写 的 


程序 9 例如 3 
for (int i = 0; i<=max; ++)j) { / oops! (twice) 
for (int i=0; 0<max; ++i); // print the elements of v 


cout << "v[In << i << "==" << v[i] << n'y 

这 个 例子 来 自 一 个 有 丰富 经 验 的 程序 员 写 的 实际 程序 (我 们 认为 它 应 该 是 在 深夜 编写 
的 ) 。 

通常 ， 如 采 你 没有 找到 问题 所 在 , 原因 可 能 是 在 上 一 个 你 能 确认 的 正确 的 输出 和 下 一 个 输 
出 (或 没有 输出 ) 之 间 代 码 太 多 。 大 多 数 编 程 环境 都 提供 逐条 语句 执行 程序 的 功能 (“ 单 步 
执行 ")。 最 终 , 你 肯定 能 学 会 使 用 这 些 工 具 。 但 对 于 简单 问题 和 简单 程序 来 说 , 你 可 以 
通过 在 程序 中 临时 加 入 一 些 额外 的 输出 语句 (利用 cerr) 来 帮助 你 检查 运行 结果。 例如 : 


int my_fct(int a, double d) 

{ 
int res = 0; 
cerr<<"my fct(" <<a<<"," <<d<< Nn"; 
//.. .misbehaving code here . . . 
cerr << "my_fct() returns " << res << \n’; 
return res; 


} 
在 可 能 会 隐藏 错误 的 语句 中 , 加 入 检查 不 变 式 ( 即 永远 成 立 的 条 件 , 参见 9.4.3 节 ) 的 语 
句 , 例如 : 


int my_complicated_function(int a, int b, int c) 
// the arguments are positive anda <b < < 
{ 
if (!(0<a && a<b && be<c)) // I means “not” and && means “and” 
error("bad arguments for mcf''); 
tis 
} 


如 有 果 还 是 没有 效果 的 话 , 在 看 起 来 不 会 有 错 的 代码 段 中 插入 检查 不 变 
“你 找 不 到 错误 ,几乎 可 以 肯定 你 是 找 错 地 方 了 。 





陈述 一 个 不 变 式 的 语句 称 为 断言 (assertion 或 assert ) 。 
更 有 趣 的 是 , 还 存在 许多 其 他 有 效 的 编程 方法 。 不 同 的 人 所 使 用 的 技术 可 能 差别 极 大 。 调 试 
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技术 的 差异 中 , 有 很 多 来 自 于 要 调试 的 程序 的 差异 ; 另外 一 些 则 是 源 自 于 人 们 不 同 的 思维 方式 。 
据 我 们 所 知 ， 目 前 还 没有 一 种 最 好 的 调试 方法 。 但 是 有 一 件 事 要 始终 牢记 ; 混乱 的 代码 总 是 容易 
隐藏 错误 。 尽 你 所 能 保证 代码 的 简洁 、 有 逮 辑 性 和 格式 的 工整 吧 , 这 将 会 大 大 减少 你 的 调试 
时 间 。 


5. 10 ”前 置 条 件 和 后 置 条 件 


现在 , 让 我 们 回 到 前 面 的 问题 ; 如 何 处 理 函数 的 参数 错误 。 基 本 上 , 函数 调用 是 思考 正确 代 
码 和 捕捉 错误 的 最 佳 位 置 : 逻辑 上 ,函数 是 一 个 独立 计算 的 开始 ( 函数 返回 是 结束 )。 看 看 我 们 利 
用 前 一 节 介绍 的 调试 技巧 做 了 什么 :- 


int my_complicated_function(int a, int b, int c) 
/ the arguments are positive anda <b<c 


if (1!(0<a && a<b && b<c)) HA ! means “not” and && means “and” 
error("bad arguments for mcef"); 
} 


首先 , 我 们 (在 注释 中 ) 说 明了 捕 数 对 于 参数 的 要 求 , 然后 在 阴 数 开始 处 检查 这 一 要 求 是 否 满足 
(如 果 不 满足 则 抛 出 一 个 异常 )。 

这 是 一 个 很 好 的 基本 策略 。 函 数 对 于 它 的 参数 的 要 求 称 为 前 置 条 件 (pre-condition ) : 如 果 函 
数 正确 执行 的 话 , 这 一 条 件 必须 为 真 。 现 在 的 问题 是 如 果 前 置 条 件 被 违反 的 话 (为 假 ), 那么 我 们 
应 该 怎么 做 。 我 们 可 以 有 两 个 选择 : 

1) 忽略 它 ( 希 望 /假设 调用 者 会 使 用 正确 的 参数 )。 

2) 检查 它 ( 并 以 某 种 形式 报告 错误 ) 。 

我 们 可 以 使 用 参数 类 型 机 制 , 它 能 让 编译 器 进行 最 简单 的 前 置 条 件 检 查 ， 并 在 编译 时 报告 错误 。 
例如 : 

int x = my_complicated_function(1, 2, "horsefeathers"); 

这 里 , 编译 器 会 检查 出 “第 三 个 参数 应 是 整 型 ”的 消 数 要 求 (“前 置 条 件 ”) 被 违反 了 。 基 本 上 , 我 
们 在 本 节 中 要 讨论 的 是 如 何 处 理 编译 器 不 能 检查 的 明 数 要 求 /前 置 条 件 。 

我 们 的 建议 是 前 置 条 件 一 定 要 在 注释 里 说 明 ( 这样 调用 者 可 以 知道 函数 的 要 求 )。 一 个 没有 
注释 文档 的 孙 数 会 被 认为 能 够 处 理 每 种 可 能 的 参数 值 。 但 是 我 们 能 够 确信 调用 者 会 读 这 些 注释 
并 遵守 其 中 的 规则 吗 ? 有 些 时 候 我 们 不 得 不 相信 调用 者 会 这 样 做 , 但 我 们 通常 还 是 要 遵循 “被 调 
用 者 进行 参数 检查 ”这 一 原则 , 它 可 以 解释 为 “让 函数 检查 自己 的 前 置 条 件 ”。 在 没有 其 他 原因 的 
情况 下 , 我 们 要 坚持 做 到 这 一 点 。 不 做 前 置 条 件 检 查 的 常见 理由 包括 : 

。 没 人 会 使 用 错误 参数 。 

。 做 前 置 条 件 检查 会 使 我 的 程序 变 慢 。 

e 检查 工作 太 复 杂 了 。 

当 我 们 知道 “ 谁 " 将 调用 这 个 函数 的 时 候 , 第 一 个 理由 是 很 合理 的 , 但 在 实际 编程 工作 中 , 这 
一 条 件 很 难 满足 。 

第 二 个 理由 成 立 的 情况 远 比 人 们 通常 认为 的 要 少 得 多 。 大 多 数 情况 下 , 它 应 该 作为 “过 早 优 
化 "的 例子 被 握 弃 掉 。 如 果 前 置 条 件 检查 被 证 实 真 的 是 程序 的 负担 的 话 , 你 当然 可 以 把 它 去 掉 。 
但 是 它 所 保证 的 程序 正确 性 就 不 能 那么 容易 获得 了 , 本 来 是 它 能 捕获 的 一 些 错 误 ， 又 需要 你 花费 
许多 不 眠 之 夜来 查找 了 。 


甸子 竟 刍 碍 9 


第 三 个 原因 是 最 严重 的 。 很 容易 地 (特别 是 对 有 经 验 的 程序 员 来 说 ) 找 到 这 种 例子 : 前 置 条 件 
检查 所 做 的 工作 比 执行 函数 本 身 还 要 多 得 多 。 一 个 例子 就 是 字典 查询 操作 : 前 置 条 件 是 字典 是 已 
排序 的 , 而 验证 一 个 字典 已 排序 的 代价 要 远 远 高 于 单纯 的 查询 操作 。 有 时 候 , 编写 前 置 条 件 检 查 
代码 以 及 判定 这 部 分 代码 是 否 正确 是 很 困难 的 。 但 是 , 每 当 你 编写 函数 的 时 候 , 你 都 应 该 考虑 是 
否 可 以 编写 一 个 快速 的 前 置 条 件 检查 代码 。 除 非 你 有 足够 的 理由 , 和 否则 始终 应 该 为 函数 编写 前 置 
条 件 检查 代码 。 \ 

编写 前 置 条 件 (即使 是 以 注释 形式 ) 还 可 以 显著 地 提高 你 的 程序 质量 : 它 能 强迫 你 考虑 函数 的 需 
求 是 什么 。 如 果 你 不 能 用 几 行 注释 把 它 简单 、 准 确 地 描述 出 来 的 话 , 那么 你 可 能 还 没有 真正 地 理解 
你 要 做 什么 。 经 验 表 明 , 编写 前 置 条 件 注释 和 前 置 条 件 检查 代码 有 助 于 避免 许多 设计 上 的 错误 。 我 
们 说 过 我 们 讨厌 调试 工作 , 使 用 前 置 条 件 将 有 助 于 避免 设计 错误 和 及 早 发 现 使 用 错误 , 例如 : 

int my_complicated_function(int a, int b, int c) 

/ the arguments are positive anda <b <c 

if (!(0<a && a<b && b<c)) // ! means “not” and && means “and’” 

error("bad arguments for mcf"); 


Ms 
} 


与 下 面 的 简化 版 本 相 比 ,上面 的 程序 将 会 节省 你 的 时 间 。 


int my_complicated_function(int a, int b, int c) 


Re 
} 


5. 10.1 后 置 条 件 

使 用 前 置 条 件 将 有 助 于 我 们 避免 设计 错误 和 及 早 发 现 使 用 错误 。 这 种 显 式 说 明和 需求 的 思想 
能 够 被 应 用 在 其 他 方面 吗 ? 是 的 , 你 可 以 马上 联想 到 : 返回 值 ! 毕竟 , 我 们 一 般 都 需要 声明 函数 
的 返回 值 是 什么 。 也 就 是 说 , 如 果 一 个 函数 返回 一 个 值 的 话 , 我 们 总 是 要 约定 这 个 返回 值 是 怎样 
的 (否则 的 话 调用 者 如 何 知道 得 到 的 是 什么 呢 ) 。 让 我 们 再 次 看 一 下 面积 函数 (参见 5. 6. 1 节 ): 


// calculate area of a rectangle; 
/throw a Bad_area exception in case of a bad argument 
int area(int length, int width) 
{ 
if (length<=0 || width <=0) throw Bad_areal); 
return length*width; 
} 


这 个 程序 检查 了 前 置 条 件 , 但 是 它 没 有 在 注释 里 面 对 此 进行 说 明 ( 对 于 这 么 一 个 小 函数 来 说 , 这 
还 是 可 以 接受 的 ), 而 且 假 定 计算 是 正确 的 (这 种 简单 计算 应 该 也 没 问题 )。 但 是 , 我 们 可 以 更 明 
确 一 些 : 

int area(int length, int width) 


/ caiculate area of a rectangle; 
/ pre-conditions: length and width are positive 


// post-condition: returns a positive value that is the area 
{ 
if (length<=0 || width <=0) error("area() pre-condition"); 
inta = length*width; 
if (a<=0) error("areal() post-condition"); 
return a; 


} 
我 们 不 可 能 对 后 置 条 件 进行 完全 检查 , 但 是 我 们 至 少 可 以 检查 其 中 一 部 分 : 返回 值 是 否 是 正 数 。 
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试 一 试 ” 举 试 找 出 一 组 数据 ,它们 能 够 满足 当前 版 本 面积 函数 的 前 置 条 件 ， 但 不 满 
足 后 置 条 件 。 
前 置 和 后 置 条 件 提供 了 基本 的 程序 完整 性 检查 。 从 这 个 角度 看 , 它们 与 不 变 式 ( 参 见 9. 4.3 
节 )、 正确 性 (参见 4.2 节 和 5.2 节 ) 和 测试 (参见 第 26 章 ) 等 概念 紧密 相关 。 


5. 11 测试 


如 何 知 道 我 们 应 该 什么 时 候 停 止 调试 呢 ? 不错, 在 找到 所 有 错误 前 , 我 们 应 该 继续 调试 , 或 
者 尽力 去 做 。 如 何 知 道 我 们 已 经 找到 了 最 后 一 个 错误 了 呢 ? 答案 是 没有 办 法 。“ 最 后 一 个 错误 ” 
是 程序 员 之 间 的 笑话 : 这 种 东西 是 不 存在 的 。 对 一 个 大 程序 来 说 , 我 们 永远 不 会 找到 “最 后 一 个 
错误 ”。 因 为 在 查找 错误 的 同时 , 我 们 还 要 忙于 按照 新 需求 修改 程序 。 

除了 调试 以 外 , 我 们 还 需要 一 种 系统 地 查找 错误 的 方法 ， 这 称 为 测试 , 我 们 将 在 7.3 节 、 第 
10 章 和 第 26 章 中 详细 介绍 相关 内 容 。 基 本 上 , 测试 是 以 一 个 较 大 的 、 经 过 系统 选择 的 数据 集 作 
为 输入 来 执行 一 个 程序 , 然后 把 相关 的 结果 与 期 望 值 进行 比较 。 基 于 一 组 给 定 输入 的 一 次 程序 运 
行 称 为 一 个 测试 用 例 (test case) 。 实 际 程序 可 能 会 需要 上 百 万 个 测试 用 例 来 进行 测试 。 基 本 上 ， 
系统 测试 不 可 能 靠 人 手工 输入 一 个 个 测试 用 例 。 在 介绍 过 后 续 几 章 内 容 并 掌握 了 必要 的 工具 后 ， 
我 们 再 正式 讨论 测试 。 在 此 期 间 , 我 们 需要 说 记 的 是 找到 错误 才 是 好 的 , 这 才 是 进行 测试 需要 秉 
承 的 态度 。 看 看 下 面 的 内 容 : 

态度 1: 我 比 任何 程序 都 聪明 ! 我 将 击败 这 些 @#$ %“^ 代 码 ! 

态度 2: 这 部 分 代码 我 已 经 打磨 了 两 周 时 间 了 。 它 是 完美 的 ! 
你 认为 谁 会 找 出 更 多 的 错误 ”当然 , 最 好 的 情况 是 一 个 有 经 验 的 人 带 着 一 点 “态度 1”, 沉着 、 冷 
静 、 耐 心地 对 程序 中 所 有 可 能 出 错 的 地 方 进行 系统 地 检查 。 好 的 测试 人 员 的 价值 不 亚 于 与 他 相同 
重量 的 黄金 。 

我 们 会 尽量 系统 地 选择 测试 用 例 ,一般 会 包括 正确 和 不 正确 的 输入 数据 。7. 3 节 中 会 给 出 第 
一 个 示例 。 


全 》 简单 练 习 


下 面 是 25 个 代码 片段 , 每 一 个 都 要 被 插 人 到 这 个 “框架 中 : 
#include "std_Jib_facilities.h” 


int main() 

try { 
<<your code here>> 
keep_window_open(); 
return 0; 

} 

catch (exception& e) { 
Cerr << "error: " << e.what() << \n'; 
keep_window_open(); 
return 1; 

} 

catch (...) { 
Cerr << "Oops: unknown exception!\n"; 
keep_window_open(); 
return 2; 


} 
每 段 代码 都 有 0 个 或 多 个 错误 。 你 的 任务 是 找 出 并 排除 每 个 程序 中 的 错误 。 当 你 排除 了 所 有 错误 后 , 程序 
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编译 、 运 行 并 输出 “Success!”。 即 使 你 认为 已 经 找到 了 一 个 错误 , 你 仍然 需要 输入 (原始 的 = 未 修改 的 ) 程 序 
并 测试 它 , 因为 你 可 能 猜 错 了 , 或 者 程序 中 的 还 有 其 他 错误 。 这 个 练习 的 另 一 个 目的 是 让 你 感受 一 下 编译 
器 对 不 同 错误 的 反应 是 什么 样 的 。 你 不 需要 输入 上 面 的 程序 框架 25 次, 用 剪 切 、 粘 贴 或 类 似 的 技术 就 可 以 
了 。。 不 要 通过 删除 一 条 语句 来 逃避 问题 , 你 应 该 试 着 通过 修改 、 增加 或 删除 一 些 字符 来 排除 问题 。 
l. Cout << "Success!\n"; 
. Cout << "SuccessI\n; 
. cout<< "Success" << I\n" 
cout << success << endl; 
string res = 7; vector<int> v(10); v[5] = res; cout << "Successl\n'; 
vector<int> v(10); v(5) = 7; if (v(5)!=7) cout << "Success!\n"; 
. if(cond) cout << "Successi\n"; else cout << "Faill\n"; 
bool c = false; if (¢) cout << "Successi\n"; else cout << "Faill\n"; 
.string s = "ape"; boo c= "fool"<s; if (¢) cout << "Successl\n"; 


= 


10. string s = "ape"; if (s=="fo0l") cout << "Successl\n"; 
11. strings= "ape"; if (s=="fo0|") cout < "Success!\n"; 
12. string s= "ape"; if (s+"fool") cout < "Successl\n"; 
13. vector<char> v(5); for (int i=0; ic=V.size(); ++i) ; cout << "Successl\n"; 
14，vector<char> v(5); for (int i=0; ji<=v.size(0); ++i) ; cout << "Successl\n"; 
15. strings = "Success!\n"; for (int i=0; i<6; ++i) cout << s[i]; 
16. if (true) then cout << "Successli\n"; else cout << "Faill\n"; 
17. intx = 2000; char c = x; if (c==2000) cout << "Successl\n"; 
18. strings= "SuccesslI\n"; for (int i=0; i<10; ++i) cout << s[i]; 
19. vector v(5); for (int i=0; i<=v.size(); ++i) ; cout << "Success!\n"; 
20. int i=0; intj= 9; while (i<10) ++j; if (j<i) cout << "Success!\n"; 
2]. intx=2; double d = 5/(x—2); if (d==2*x+0.5) cout << "Successl\n"; 
22. string<char> s= "Successl\n"; for (int i=0; i<=10; ++i) cout << s[i]; 
23. inti=0; while (i<10) ++); if (j<i) cout << "SuccessI\n"; 
24, intx=4; double d = 5/(x—2); if (d=2*x+0.5) cout << "Successl\n"; 
25. cin<< "Successtnn 
人》 思考 是 
. 举 出 4 种 主要 错误 类 型 并 给 出 它们 的 简洁 定义 。 
.在 学 生 练 习 程 序 中 , 什么 类 型 的 错误 我 们 可 以 忽略 ? 
. 每 一 个 完整 的 程序 应 该 能 提供 什么 保证 ? 
. 举 出 3 种 可 以 减少 程序 错误 , 开发 出 符合 要 求 的 软件 的 方法 。 
.为 什么 我 们 会 讨厌 调试 ? 
， 什 么 是 语法 错误 ? 给 出 5 个 例子 。 
， 什 么 是 类 型 错误 ? 给 出 5 个 例子 。 
. 什么 是 连接 器 错误 ? 给 出 3 个 例子 
9. 什么 是 逻辑 错误 ? 给 出 3 个 例子 
10. 列 出 4 种 本 章 中 讨论 的 可 能 导致 程序 错误 的 因素 。 
11. 你 如 何 能 知道 一 个 结果 是 合理 的 ?回答 这 类 问题 , 你 会 用 到 什么 技术 ? 
12. 对 比 一 下 由 晴 数 调用 者 来 处 理 运 行 时 错误 和 由 被 调 函 数 来 人 处理 运行 时 错误 的 异同 。 
13. 为 什么 说 使 用 异常 比 返回 一 个 “错误 值 " 要 好 ? 


6 = i 二 


14. 
15. 
16. 


17. 
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你 应 该 如 何 测试 一 个 输入 操作 是 否 成 功 ? 

描述 一 下 抛 出 和 捕获 异常 的 过 程 。 

有 一 个 名 为 * 的 向 量 , 为 什么 vt v. size( ) ] 会 导致 值 范围 错误 ? 这 一 调用 会 导致 什么 结 

描述 一 下 前 置 条 件 和 后 置 条 件 的 定义 ; 并 举 个 例子 (不 能 用 本 章 中 的 area( ) 函数 ) ， 0 循环 


的 计算 过 程 。 


18. 
.什么 时 候 你 不 会 测试 后 置 条 件 ? 

. 调试 程序 时 的 单 步 执 行 是 指 什么 ? 

. 在 调试 程序 时 , 注释 会 有 什么 帮助 ? 
22: 


什么 时 候 你 不 会 测试 前 置 条 件 ? 


测试 与 调试 有 什么 不 同 ? 

避 术语 
参数 错误 。 异常 需求 断言 不 变 式 运行 时 错误 
捕获 连接 时 错误 语法 错误 编译 时 错误 逻辑 错误 测试 
容 需 后 置 条 件 抛 出 调试 前 置 条 件 类 型 错误 
错误 范围 错误 : 


<》 习题 


1. 如 果 你 还 没有 完成 本 章 中 的 “ 试 一 试 ”， 请 先 完成 相关 练习 o 


Lo 


. 下 面 的 程序 是 获得 摄氏 温度 值 并 将 其 转化 为 绝对 温度 。 但 这 些 代 码 有 很 多 错误 , 找到 这 些 错误 , 指出 并 


修改 它们 。 
double ctok(double c) / converts Celsius to Kelvin 
{ 

int k = ¢ + 273.15; 

return int 


} 


int main() 
{ 


double c=0;  / declare input variable. 


cin >> d; / retrieve temperature to input variable 
double k = ctok("c™); / convert temperature 
Cout <<k << endl ; I print out temperature 


} 


. 绝对 零度 是 能 够 达到 的 最 低温 度 , 即 -273. 15 世 或 0K。 即 使 上 面 的 程序 是 正确 的 , 当 输 入 一 个 低 于 这 个 


值 的 温度 时 , 程序 也 应 输出 错误 结果 。 检 查 一 下 ， 当 输入 一 个 低 于 -273. 1SY 的 数值 时 , 主 程序 是 否 产 
生 错 误 。 


， 重 做 练习 3, 但 这 次 把 错误 处 理 放 在 ctok( ) 中。 
， 给 这 个 程序 增加 一 些 功能 , 使 它 也 可 以 把 绝对 温度 转化 为 摄氏 温度 。 
. 编写 一 个 程序 , 它 可 以 实现 绝对 温度 转化 为 华氏 温度 和 华氏 温度 转换 为 绝对 温度 (公式 见 4.3.3 节 )。 用 


估计 的 方法 (参见 5. 8 节 ) 看 看 你 的 结果 是 否 合理 。 


. 一 元 二 次 方程 的 形式 如 下 


a':x+b:x+c=0 


解 这 个 方程 , 用 到 二 次 公式 : 


这 里 面 有 一 个 问题 ; 如 果 咏 -4ac 小 于 零 的 话 , 它 将 出 错 。 编 写 一 个 可 以 解 一 元 二 次 方程 的 程序 。 建 立 一 


个 可 以 计算 二 次 方程 根 的 函数 , 给 定 ce, 如果 六 -4ac 小 于 0 就 抛 出 一 个 异常 。 让 程序 的 主 函数 调用 
这 个 函数 ,如果 有 错误 由 主 函 数 捕获 异常 。 当 程序 发 现 方程 没有 实 根 的 时 候 , 输出 相应 的 信息 。 你 如 何 


确定 程序 的 结果 是 合理 的 ? 你 能 检验 结果 的 正确 性 吗 ? 
8， 编 写 一 个 程序 , 读 取 一 个 整数 序列 , 并 计算 前 N 个 整数 之 和 。 它 首先 询问 N 的 值 , 然后 读 取 N 个 值 并 存 
入 一 个 vector 中 , 再 计算 前 N 个 值 之 和 。 例 如 : 
请 输入 你 希望 求 和 的 值 的 数量 : 
3 
请 输入 一 些 整数 ( 按 '1 结 束 输入 ) : 
1l2 23 13 24 13| 
前 3 个 数 (12 23 13) 之 和 是 48 

9. 修改 练习 6 的 程序 : 如 果 结 果 不 能 表示 为 整 型 的 话 , 输出 一 个 错误 信息 。 

10. 修改 练习 8 的 程序 ; 使 用 double 而 不 是 int。 同 时 保证 vector 中 临近 的 数值 是 不 同 的 ， 并 输出 ， vector 中 的 数值 。 

11. 编写 程序 , 输出 尽量 长 的 斐 波 那 契 序 列 , 也 就 是 说 , 序列 的 开始 是 1 1 2 3 5 8 13 21 34, 下 一 个 数 是 前 两 
个 数 的 和 。 找 出 int 能 允许 的 最 大 的 斐 波 那 契 数 。 

12. 实现 一 个 名 为 “公牛 和 母 牛 ”( 不 知道 是 谁 命名 的 ) 的 竞猜 程序 。 程 序 用 一 个 向 量 存储 4 个 0 到 9 之 间 的 
整数 , 用 户 的 任务 是 通过 重复 猜测 找到 这 些 数 。 例 如 , 如果 存 储 的 是 1234 而 用 户 猜 测 的 是 1359, 程序 
的 反馈 结果 是 “一 头 公 牛 一 头 母 牛 ”。 因 为 用 户 的 猜测 中 有 一 位 正确 (1) 并 且 它 在 正确 的 位 置 (一 头 公 
牛 ) , 有 一 位 正确 (3) 但 它 在 错误 的 位 置 (一 头 母 牛 ) 。 反 复 这 一 猜测 过 程 , 直到 用 户 找到 4 头 公牛 , 即 找 
到 这 4 个 数字 且 都 在 正确 的 位 置 。 

13. 上 一 题 的 程序 有 点 乏味 ,因为 答案 硬 编码 到 程序 中 了 。 编 写 一 个 新 版 本 : 用 户 可 以 重复 玩 这 个 游戏 (不 
需要 停止 或 重启 游戏 ) , 每 一 次 游戏 生成 一 组 新 的 4 个 数 的 集合 。 你 可 以 通过 4 次 调用 std_lib_facili- 
ties. h 中 的 随机 数 发 生 器 randint(10) 来 生成 4 个 随机 数 。 但 你 会 发 现 , 当 你 重复 执行 这 个 程序 的 时 候 ， 
每 一 次 程序 都 会 给 出 4 个 相同 的 数 。 为 了 避免 这 一 点 , 你 可 以 要 求 用 户 输入 一 个 数 (可 以 是 任意 数字 ) ， 
然后 在 调用 randint(10) 之 前 先 调用 srand(n) , 这 里 n 是 用 户 所 输入 的 数 , 这 个 n 称 为 种 子 , 不 同 的 种 子 
会 生产 不 同 的 随机 数 序列 。 

14. 从 标准 输入 中 读 入 (星期 , 数值) 对, 例如: 
星期 二 23 星期 五 56 星期 二 -3 星期 四 99 
将 一 个 星期 中 每 一 天 对 应 的 所 有 数值 存 人 一 个 vector < int > 中 。 输 出 7 个 向 量 中 的 值 。 打 印 每 个 vector 
中 的 值 的 总 和 。 忽 略 输入 中 的 非法 日 期 , 例如 Funday, 但 是 接受 同义词 , 例如 Mon 和 monday。 输 出 被 拒 
绝 数值 的 个 数 。 


<》 附 言 

你 认为 我 们 过 分 强调 错误 了 吗 ? 作为 初学 者 我 们 可 能 会 这 么 想 。 显 然 , 一 个 自然 的 反应 是 “这 么 简单 的 
程序 不 可 能 出 错 ”。 但 是 , 错误 总 是 会 发 生 的 。 许 多 世界 上 最 聪明 的 人 都 惊讶 和 困惑 于 编写 正确 程序 所 具有 
的 难度 。 根 据 我 们 的 经 验 , 好 的 数学 家 是 最 可 能 低估 错误 问题 的 人 群 。 但 我 们 都 会 认识 到 : 所 编写 的 程序 
一 次 通过 是 一 件 超出 我 们 能 力 范围 的 事 。 你 已 经 被 警告 过 了 ! 尽管 我 们 会 尽 自己 所 能 , 但 是 错误 不 可 如 免 
地 会 出 现在 刚刚 编写 完 的 程序 中 。 幸 运 的 是 , 经 过 了 50 年 或 更 长 的 时 间 , 我 们 已 经 拥有 了 许多 如 何 组 织 代 
码 来 最 小 化 错误 数目 的 经 验 ,以 及 相关 的 错误 查找 技术 。 本 章 中 介绍 的 技术 和 示例 就 是 一 个 好 的 开端 
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“程序 设计 就 是 问题 理解 。” 
——Kristen Nygaard 


编写 程序 需要 不 断 地 细 化 所 实现 的 功能 及 其 表达 方式 。 接 下 来 的 这 两 章 详细 讲述 了 程序 的 
开发 过 程 ， 从 一 个 并 不 十 分 清晰 的 想法 开始 , 经 过 分 析 、 设计 、 实现 、 测试 、 再 设计 和 再 实现 等 步 
又 , 最 终 实 现 预 期 目标 程序 。 本 章 主要 讨论 程序 结构 、 用 户 定 义 类 型 和 输入 处 理 等 内 容 , 目的 是 
帮助 读者 了 解 在 编写 代码 过 程 中 如 何 去 思 考 。 


6. 1 一 个 问题 


程序 的 编写 往往 都 是 从 一 个 问题 出 发 , 也 就 是 说 , 借助 程序 来 解决 一 个 实际 问题 , 因此 正确 
理解 问题 对 程序 实现 是 非常 关键 的 。 毕 况 , 解决 一 个 理解 错误 的 问题 的 程序 很 可 能 是 没有 用 处 
的 ,即使 它 是 一 个 完美 的 程序 。 或 许 这 个 程序 恰好 对 从 来 没有 想到 的 某 些 问题 是 有 用 的 ,但 这 种 
幸运 事件 发 生 的 概率 非常 小 。 因 此 ,所 设计 的 程序 应 该 简单 、 清 晰 地 解决 要 处 理 的 问题 。 

在 这 个 阶段 , 一 个 好 的 程序 应 该 具有 以 下 几 个 特点 : 

。 阐明 设计 和 编程 技术 。 

。 易于 探究 程序 员 做 出 的 各 种 各 样 的 决策 及 其 相关 考虑 。 

。 不 需要 很 多 新 的 滞 言 结构 。 

。 对 设计 的 考虑 足够 全 面 。 

。 考虑 所 有 可 能 的 解 。 

。 解决 一 个 易于 理解 的 问题 。 

。 解决 一 个 有 价值 的 问题 。 

。 具有 一 个 足够 小 ,， 从 而 可 完整 实现 、 彻底 理解 的 求解 方案 。 
我 们 编写 一 个 简单 的 计算 器 , 实现 计算 机 对 输入 表达 式 的 常规 算术 运算 。 无 疑 这 类 程序 是 很 有 用 
的 , 在 每 个 台式 计算 机 中 都 安装 有 这 样 的 计算 右 程 序 , 甚至 我 们 可 以 购买 专门 运行 该 程序 的 计算 
机 : 袖珍 计算 器 。 例 如 输入 : 


2+3.1*4 


程序 应 该 输出 : 


14.4 
不 幸 的 是 , 这 样 的 计算 器 程序 在 我 们 的 电脑 上 已 经 随处 可 见 , 它 不 会 给 我 们 带 来 任何 新 功能 , 但 
作为 第 一 个 程序 , 我 们 可 以 从 其 中 获得 很 多 内 容 。 


6.2 对 问题 的 思考 


我 们 如 何 开始 ? 大 体 上 说 , 我 们 要 做 的 就 是 对 问题 和 问题 求解 方法 进行 思考 。 首 先 , 考虑 程 
序 应 该 完成 什么 人 机 交互 的 方式 是 怎样 的 。 然 后 , 考虑 如 何 设计 程序 才能 实现 这 样 的 功能 。 试 
着 写 出 每 个 解决 方案 的 简单 框架 , 并 检验 它们 的 正确 性 。 或 许 与 朋友 讨论 这 个 问题 及 其 解决 方 
法 , 试 着 给 朋友 讲述 你 的 想法 , 是 一 种 很 好 的 发 现 错误 的 方式 , 其 至 比 写 下 来 都 要 好 很 多 , 因为 
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纸 (或 者 计算 机 ) 不 能 对 你 的 假设 提出 疑问 , 不 能 反驳 你 的 错误 观点 。 总 之 , 设计 不 是 一 个 孤独 的 
过 程 。 
不 幸 的 是 , 不 存在 对 所 有 人 和 所 有 问题 都 有 效 的 通用 解决 策略 。 有 些 书 通 篇 都 在 帮助 读者 学 
习 更 好 地 求解 问题 ,其 他 大 部 分 书籍 则 侧重 于 程序 设计 。 我 们 并 不 那么 做 ,相反 , 本 书 针对 一 些 
个 人 能 够 处 理 的 小 规模 问题 给 出 若干 有 价值 的 通用 求解 策略 , 然后 以 微型 计算 器 程序 为 例 对 这 些 
策略 进行 验证 。 
建议 读者 带 着 疑问 阅读 关于 计算 器 程序 的 讨论 。 实 际 上 , 一 个 程序 的 开发 要 经 过 一 系列 版 
本 , 每 个 版 本 实现 了 我 们 得 到 的 一 些 推 论 。 很 明显 , 某 些 推论 是 不 完全 的 甚至 是 错误 的 ,否则 可 
以 更 早 就 结束 本 章 的 学 习 。 随 着 讨论 的 深入 , 我 们 逐步 给 出 了 各 种 各 样 的 关注 点 和 推论 的 实例 ， 
这 些 都 是 设计 者 和 程序 员 一 直 要 面 对 和 处 理 的 , 直到 第 7 章 结尾 才 完成 这 个 程序 的 最 终 版 本 。 
学 习 本 章 和 第 7 章 时 要 记 住 , 实现 程序 最 终 版 本 的 过 程 一 一 提出 部 分 解 、 产 生 想 法 和 发 现 错 
误 的 历程 一 一 与 程序 最 终 版 本 本 身 同 样 重要 , 甚至 比 实现 过 程 中 磁 到 的 语言 技术 细节 更 重要 (后 
面 还 会 讲 到 这 些 问题 ) 。 
6.2.1 程序 设计 的 几 个 阶段 
下 面 是 程序 开发 涉及 的 几 个 术语 。 解 决 一 个 问题 需要 反复 经 历 以 下 阶段 : 
。 分 析 (analysis) ; 判断 应 该 做 什么 并 且 给 出 对 当前 问题 理解 的 描述 , 称 为 需求 集合 (a set of 
requirements ) 或 者 规范 (specification)。 我 们 并 不 详细 讨论 如 何 开 发 和 撰写 这 些 规范 , 这 已 
经 超出 本 书 的 范围 , 但 问题 的 规模 越 大 , 这 种 规范 就 越 重要 。 
。 设计 (design) : 给 出 系统 的 整体 结构 图 , 并 确定 具体 的 实现 内 容 以 及 它们 之 间 的 相互 联 
系 。 作 为 设计 的 一 个 重要 方面 , 要 考虑 哪些 工具 (如 函数 库 ) 有 助 于 实现 程序 的 结构 。 
。 实现 (implementation ) : 编写 代码 、 调 试 和 测试 , 确保 程序 完成 预期 的 功能 。 
6.2.2 策略 
下 面 是 一 些 对 很 多 程序 设计 项 目 都 有 帮助 的 建议 : 
。 要 解决 的 问题 是 什么 ?首要 的 事情 是 将 要 完成 的 目标 具体 化 , 包括 建立 问题 的 描述 , 或 者 
分 析 已 有 描述 的 真实 意图 。 这 个 时 候 应 该 站 在 用 户 而 不 是 程序 员 的 角度 上 , 也 就 是 说 , 应 
该 考虑 程序 要 实现 什么 功能 ,而 不 是 怎样 实现 这 些 功能 。 例 如 ,这 个 程序 能 够 实现 什么 功 
能 ?用 户 与 程序 以 什么 方式 进行 交互 ? 记 住 , 大 多 数 人 都 具有 很 丰富 的 计算 机 使 用 经 验 。 
。 问题 定义 清楚 了 吗 ?” 事实 上 , 我 们 无 法 十 分 清晰 地 定义 一 个 现实 问题 ,即使 是 一 个 学 生 
练习 题 , 也 很 难 将 其 准确 和 具体 地 定义 。 但 是 , 解决 一 个 错误 的 问题 是 很 遗憾 的 ,所 以 
必须 弄 清楚 所 要 解决 的 问题 是 什么 。 另 一 个 易 犯 的 错误 是 我 们 容易 把 问题 复杂 化 , 在 描 
” 述 一 个 要 处 理 的 问题 时 总 是 表现 得 过 于 贪心 /有 野心 。 实 际 上 , 更 好 的 方式 是 将 问题 简 
化 , 使 程序 易于 定义 、 理 解 、 使 用 和 实现 。 一 且 程 序 能 够 实现 项 期 的 功能 ， 基于 已 有 的 
经 验 可 以 实现 它 的 第 二 版 。 
,看 上 去 问 题 是 可 以 处 理 的 ,但 时 间 、 技巧 和 工具 是 天 足够 ? 从 事 一 项 不 可 能 完成 的 项 目 
是 没有 意义 的 。 因 此 , 如果 没有 足够 的 时 间 来 实现 (包括 测试 ) 一 个 程序 , 最 好 不 要 启动 
这 个 项 目 。 否 则 , 需要 获取 更 多 的 资源 (包括 时 间 ) 或 者 修改 需求 来 简化 任务 。 
将 程序 划分 为 可 分 别处 理 的 多 个 部 分 。 为 了 解决 一 个 实际 问题 , 即使 是 一 个 最 小 的 程序 
也 能 够 进一步 细 分 。 
" 你 知道 有 哪些 工具 、 函数 库 或 者 其 他 辅助 手段 吗 ? 答案 是 肯定 的 ， 因为 即使 在 学 习 编 程 
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的 最 初 阶段 , 你 也 能 使 用 C++ 标准 范 数 库 的 部 分 内 容 。 以 后 , 还 会 慢 慢 学 习 如 何 使 用 标 
准 函 数 库 的 更 多 功能 , 还 会 用 到 图 形 和 GUI 库 、 矩 阵 库 等 。 在 获得 了 一 些 编程 经 验 之 
后 , 通过 简单 的 网 络 搜索 就 能 发 现 更 多 的 函数 库 。 记 住 , 在 编写 真正 实用 的 软件 时 , 重 
新 设计 基本 模块 是 没有 价值 的 。 在 学 习 编 程 的 时 候 是 另外 一 回 事 , 通过 重新 设计 基本 模 
块 可 以 更 清楚 地 了 解 其 实现 过 程 。 通 过 使 用 函数 库 节 约 的 时 间 可 以 用 于 解决 问题 的 其 
他 部 分 , 或 者 休息 。 但 是 ， 如 何 知 道 一 个 函数 库 是 否 适合 于 目前 的 任务 , 或 者 程序 性 能 
是 否 满足 要 求 是 一 个 很 困难 的 问题 。 一 种 解决 方法 是 咨询 同事 、 讨论 组 , 或 者 在 使 用 区 
数 库 前 首先 使 用 例子 进行 验证 。 

a 寻找 可 以 独立 描述 的 部 分 解决 方案 (或 许 能 用 在 程序 中 的 多 个 地 方 , 甚至 能 用 于 其 他 程 
序 ).。 发 现 这 样 的 解决 方案 需要 经 验 , 因此 本 书 提 供 了 很 多 实例 , 目前 我 们 已 经 用 到 了 
vector、string 和 iostream( cin 和 cout)。 本 章 给 出 第 一 个 完整 的 实例 , 展示 了 用 户 预 定义 
类 型 (Token 和 Token_stream ) 的 设计 、 实 现 和 使 用 。 第 8 章 、 第 13 至 第 15 章 给 出 了 更 多 
的 实例 , 并 给 出 了 它们 的 设计 思路 。 现 在 考虑 一 个 类 似 的 问题 : 如 果 要 设计 一 辆 汽车 ， 
首先 应 该 确定 它 的 每 个 组 成 部 分 , 包括 车 轮 、 发动机、 座 椅 、 门 把 手 等 , 在 组 装 整 车 之 前 
这 些 组 件 都 可 以 独立 生产 。 一 辆 汽车 包含 成 千 上 万 的 组 件 , 一 个 程序 也 是 如 此 ， 只 不 过 
它 的 每 个 组 件 是 代码 而 已 。 如 果 没 有 钢材 、 塑料 和 木材 等 原材料 , 我 们 是 不 能 直接 制造 
出 汽车 的 , 同样 , 没有 语言 提供 的 表达 式 、 语句 和 类 型 , 我们 也 不 能 直接 编写 出 程序 。 
设计 和 实现 这 种 组 件 是 本 书 的 一 个 重要 主题 , 也 是 软件 开发 的 重要 方法 , 参见 第 9 章 的 
用 户 自 定义 类 型 , 第 14 音 的 类 的 分 层 结 构 和 第 20 章 的 泛 型 。 

e 实现 一 个 小 的 、 有 限 的 程序 来 解决 问题 的 关键 部 分 。 当 我 们 开始 程序 设计 时 ,对 要 求解 的 
问题 并 不 十 分 了 解 。 我 们 常常 认为 我 们 很 了 解 ( 难 道 还 不 知道 一 个 计算 器 程序 是 什么 
吗 ) , 但 实际 上 并 不 是 这 样 。 只 有 充分 思考 (分 析 ) 并 且 实 验 (设计 和 实现 ) 之 后 才能 深入 
理解 要 求解 的 问题 , 才能 编写 出 一 个 好 的 程序 。 因 此 , 实现 一 个 小 的 、 有 限 的 程序 应 做 到 
以 下 两 点 : 

a | 出 我 们 的 理解 、 思想 和 工具 中 存在 的 问题 。 z 
sa .看 看 能 否 改变 问题 描述 的 一 些 细节 使 其 更 加 容易 处 理 。 当 我 们 分 析 问 题 并 给 出 初步 设 

计时 ,预先 估计 出 所 有 问题 几乎 是 不 可 能 的 。 我 们 必须 充分 利用 代码 编写 和 测试 过 程 中 

的 反馈 信息 。 

有 时 这 样 一 个 用 于 实验 的 小 程序 称 为 原型 ( a 。 如 果 第 一 个 程序 不 能 工作 或 

. 者 很 难 在 此 基础 上 继续 下 去 , 可 以 将 其 丢弃 , 基于 已 有 的 经 验 重 新 设计 一 个 原型 程 
序 ， 直到 找到 一 个 满意 的 版 本 为 止 。 不 要 在 一 个 混乱 的 版 本 上 继续 下 去 , 否则 将 会 
越 来 越 混乱 。 
实现 一 个 完整 的 解决 方案 , 最 好 是 能 够 利用 最 初版 本 中 的 组 件 。- 理 想 情况 是 逐步 构建 组 
件 来 编写 一 个 程序 , 而 不 是 一 下 子 写 出 所 有 代码 。 要 不 然 , 你 就 得 希望 奇迹 发 生 了 ， 期待 
一 些 未 经 检验 的 想法 能 够 实现 我 们 设想 的 功能 。 


6.3 回 到 计算 器 问题 


如 何 与 计算 器 进 和 5 交互 ? 这 个 问题 容易 解决 : 因为 我 们 知道 如 何 使 用 ， cin 和 cout。 但 图 形 用 
户 界 面 (GUI) 直到 第 16 章 才 讲述 , 因此 这 里 使 用 键盘 和 控制 台 窗 口 。 假 设 从 键盘 输入 表达 式 ， 然 
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后 计算 并 将 结果 显示 在 屏幕 上 。 例 如 ， 
Expression: 2+2 
Result: 4 
Expression: 2+2*3 
Result: 8 
Expression: 2+3-25/5 
Result: 0 


2 +2 和 2+2*3 等 表达 式 是 由 用 户 输入 的 ， 而 其 他 内 容 则 是 由 程序 输出 的 。 我 们 选择 输出 “Ex- 
pression: ”提示 用 户 输入 表达 式 ， 当 然 可 以 使 用 “Please enter an expression followed by a newline”, 但 
显得 过 于 元 长 , 没有 意义 ; 另外 , 短 提示 符 ”> "又 显得 过 于 模糊 。 像 这 样 尽早 给 出 如 何 使 用 程序 
的 例子 是 很 重要 的 , 这 为 程序 最 低 限度 应 该 实现 哪些 功能 提出 了 非常 实际 的 定义 。 在 程序 的 设计 
与 分 析 过 程 中 , 这 样 的 实例 通常 称 为 用 例 (use cases) 。 

当 第 一 次 碰 到 计算 器 问题 时 , 大 多 数 人 对 于 程序 的 主要 逻辑 提出 如 下 想法 ; 


read_a_line 
calculate I do the work 
write_result 


像 上 面 这 样 的 描述 称 为 伪 代 码 ( pseudo code), 并 不 是 真正 的 程序 代码 。 在 设计 的 初始 阶段 ， 当 对 
问题 的 定义 并 不 完全 清晰 的 时 候 , 往往 采用 这 种 伪 代 码 形式 加 以 描述 。 例 如 , 在 上 面 的 伪 代 码 描 
述 中 ,“calculate "是 一 个 函数 调用 吗 ? 如 果 是 , 它 的 参数 是 什么 ? 在 这 个 阶段 回答 这 些 问 题 还 为 
时 过 早 。 
6. 3. 1 第 一 步 尝 试 

在 这 个 阶段 , 我 们 并 没有 准备 好 编写 计算 器 程序 。 我 们 对 问题 还 没有 深入 思考 , 不 过 思考 总 
是 比较 困难 的 , 而 且 像 大 多 数 程 序 员 一 样 , 我 们 急于 编写 程序 代码 。 下 面 让 我 们 试 一 试 , 编写 一 
个 简单 的 计算 器 程序 , 看 看 它 将 我 们 引 向 哪里 。 按 照 最 初 想法 设计 的 程序 如 下 : 

帮 mclude "std_lib_facilities.h" 

int main() 

{ 


cout << "Please enter expression (we can handle + and —): "， 
int lval = 0; 

int rval; 

char op; 

int res; 

cin>>lval>>0p>>rval; I read something like 1 + 3 


if (op=='+") 
res = lval + rval; I addition 
else if (0p=='—") 
. res = lval ~ rval; I subtraction 


cout << "Result: n << Tes << nn'， 
keep_window_open(); 
return 0; 


} 
上 面 的 程序 读 取 运 算 符 隔 开 的 两 个 运算 对 象 ( 如 2 +2), 计算 并 打印 结果 值 ( 本 例 为 4) , 其 中 运算 
符 左 边 的 变量 名 为 lval, 右边 的 变量 名 为 rval。 

这 个 程序 能 够 运行 了 ! 但 如 果 这 个 程序 不 完整 将 会 怎样 ”让 程序 运转 起 来 感觉 是 很 棒 的 ! 也 
许 程序 设计 和 计算 机 科学 并 不 像 大 家 所 说 的 那么 难 。 好 吧 , 也 许 是 这 样 的 , 但 不 要 过 早 沉迷 于 这 
小 小 的 成 功 。 继 续 下 面 几 项 工作 : 
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1) 进一步 清理 代码 。 

2) 加 入 乘法 和 除法 (如 2*3)。 

3) 加 入 处 理 多 个 操作 符 的 功能 (如 1 +2 +3)。 
特别 地 , 我 们 应 该 检查 输入 的 内 容 是 否 符合 要 求 (但 由 于 勿 忙 , 我 们 “忘记 了 ”)。 男 外 ， 如果 一 个 
变量 的 值 可 能 是 多 个 常量 之 一 , 检测 它 的 值 最 好 采用 switch 语句 而 不 是 站 语句 。 

对 于 “1 +2 +3 +4” 这 种 包含 多 个 运算 符 的 表达 式 , 按照 它们 的 输入 顺序 进行 加 法 运算 , 也 就 
是 说 , 从 1 开始 , 输入 +2 后 计算 1+2( 得 到 中 间 结 果 3), 输入 +3 后 将 其 加 到 中 间 结 果 上 ,直到 
运算 结束 。 经 过 一 些 简 单 的 语法 和 逻辑 修改 之 后 得 到 如 下 程序 : 


机 nclude "std_lib_facilities.h" 


int main() 
{ 
cout << "Please enter expression (we can handle +, -~, *, and ) \n"; 
cout << "add an x to end expression (e. g.,1+2*3;):"; 
int lval = 0; 
int rval; 
char op; : 
cin>>lval; // read leftmost operand. 
if (Llcin) error("no first operand"); | 
while (cin>>0op) { // read operator and right-hand operand repeatedly 
if (Op!=";" )cin>>rval; 
if (1cin) error("no second operand"); 
switch(op) { 
Case '+': 
lval += rval; //add: lval =lval +rval 
break; 
Case —': 
lval -=rval; //subtract: Ival = lval- rval . 
break; 
Case 中 
lval *= rval; // multiply: lval = ival * rval 
break; 
case /': 
lval /= rval; /divide: lval = lval / rval 
break; 
default: // not another operator: print result 
cout << "Result: ® << lval << \n'; 
keep_window_open(); 
return 0; 


} 
error("bad expression"); | 
} | 

程序 没有 错 , 但 当 我 们 输入 1 +2 * 3 时 输出 的 结果 是 9, 而 不 是 正确 结果 7。 同 样 , 表达 式 1 -2 *3 
的 计算 结果 为 -3 而 不 是 正确 结果 -5。 问 题 在 于 我 们 的 计算 顺序 是 错误 的 : 1 +2 * 3 是 按照 
(1+2) *3 的 顺序 计算 的 , 而 不 是 通常 的 1+ (2*3)。 同 样 , 1 -2*3 是 按照 (1 -2) *3 而 不 是 
1 - (2 *3) 的 顺序 计算 的 。 真 糟糕 ! 这 种 延续 了 几 百 年 的 人 们 所 习惯 的 运算 规则 不 会 因为 简化 程 
序 设计 而 消失 , 因此 我 们 不 能 对 “乘法 的 优先 级 高 于 加 法 "这 种 约定 熟视无睹 。 
6.3.2 单词 
我们 必须 “向 前 ”看 这 一 行 表达 式 中 有 没有 乘法 或 者 除法 运算 符 。 如 果 有 ,必须 调整 这 种 简单 
”的 从 左 到 右 的 计算 顺序 。 然 而 ， 当 我 们 试图 这 样 做 时 , 立刻 遇 到 了 很 多 困难 : 
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1) 我 们 并 没有 必须 要 求 表达 式 在 一 行 输入 , 例如 : 
1 
2 


目前 的 代码 能 够 正确 地 计算 其 结果 。 

2) 如 何在 数字 之 间 搜 索 ”* ”( 或 者 “/”) 操作 符 ， 而 且 该 表达 式 有 可 能 分 散在 多 行 ? 

3) 如 何 记 住 ** ”操作 符 的 位 置 ? 

4) 如 何不 按 从 左 到 右 的 顺序 计算 表达 式 的 值 (如 1+2*3)? 

让 我 们 做 一 回 极端 的 乐观 主义 者 , 首先 解决 前 三 个 问题 , 不 去 担心 最 后 一 个 问题 , 我 们 将 在 
后 面 考虑 它 。 

我 们 四 处 寻求 帮助 , 肯定 有 人 知道 如 何 从 输入 读 取 包括 数字 和 操作 符 在 内 的 表达 式 的 方法 ， 
而 且 以 一 种 看 起 来 非常 合理 的 方式 进行 存储 。 答 案 就 是 “分 词 ”(tokenize) : 读 取 输 入 字符 并 组 合 


为 单词 ， 因 此 如 果 键 人 : 
45411.577 


程序 将 产生 一 个 单词 列表 


单词 (token) 是 表示 可 以 看 做 一 个 单元 的 一 个 字符 序列 , 例如 数字 或 者 运算 符 , 这 也 是 C++ 编译 
器 处 理 源 代 码 的 方法 。 实 际 上 ,“ 分 词 ”在 某 种 形式 上 是 文本 分 析 经 常 采用 的 方法 。 以 C++ 表达 
式 为 例 , 可 以 看 出 所 需 的 三 种 单词 类 型 . 

e 浮 点 常量 : 如 C++ 定义 的 3.14.0.274e2 和 42 

e 运算 符 : +、-、* 、/、% 

e 括号 :(，) 
浮 点 常量 看 起 来 是 个 问题 ; 读 取 12 比 12. 3e -3 容易 得 多 , 但 计算 器 确实 应 该 做 浮 点 运算 。 同 样 ， 
我 们 的 程序 必须 能 识别 括号 , 否则 计算 器 会 显得 没有 用 处 。 

如 何在 程序 中 表示 这 样 的 单词 ? 试图 记录 每 个 单词 的 开始 ( 和 结束 ) 会 非常 繁琐 、 杂 乱 , 尤其 
是 在 允许 表达 式 跨行 的 情况 下 。 而 且 , 如 果 将 数 保存 为 字符 串 , 之 后 必须 恢复 它 的 数值 。 也 就 是 
说 , 如 果 将 数 42 存储 为 字符 4 和 2, 以 后 必须 计算 这 些 字符 所 表示 的 数值 42, 即 4* 10 +2。 一 种 
较 好 的 解决 方法 是 将 每 个 单词 表示 为 (kind, value) 对 ,kind 表示 单词 是 一 个 数 、 运 算 符 还 是 括号 。 
对 于 数 (在 本 例 中 , 也 只 有 数 ), value 保存 的 就 是 它 的 数值 。- 

那么 , 如 何在 代码 中 表示 一 个 (kind, value) 对 ? 我 们 定义 一 个 类 型 Token 来 表示 单词 。 为 什么 

要 这 么 做 ? 记 住 我 们 为 什么 使 用 类 型 : 它们 定义 了 所 需要 的 数据 以 及 对 数据 能 执行 的 有 效 操作 。 例 
如 , int 类 型 定义 了 整数 及 其 加 、 减 、 乘 、 除 和 模 等 运算 ， 而 string 类 型 定义 了 字符 串 及 其 连接 、 下 标 
等 操作 。C ++ 语 言及 其 标准 函数 库 提 供 了 很 多 类 型 ， 如 char、int、double、string、vector 和 ostream 
等 , 但 没有 Token 类 型 。 事 实 上 , 我 们 希望 使 用 的 类 型 成 千 上 万 甚至 更 多 , 但 语言 及 其 标准 函数 库 都 
未 能 提供 , 其 中 比较 有 用 的 类 型 有 第 24 章 的 Matrix 类 型 、 第 19 章 的 Date 类 型 以 及 无 限 精度 整数 类 
型 (请 尝试 在 互联 网 中 搜索 “Bignum”) 等 。 你 将 会 意识 到 一 种 语言 不 可 能 提供 成 千 上 万 的 类 型 ; 谁 来 
定义 和 实现 这 些 类 型 ? 你 怎样 找到 这 么 多 类 型 ? 参考 手册 将 会 多 么 厚 ? C++ 等 高 级 语言 通过 让 用 
户 在 需要 的 时 候 自己 定义 类 型 (user-defined type) 而 成 功 解 决 了 这 个 问题 。 
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6. 3. 3 实现 单词 
在 程序 中 的 单词 应 该 是 什么 样 的 ? 换 名 话说,， 自 定义 的 Token 类 型 是 什么 样 的 ? Token 必须 
能 够 表示 运算 符 ( 如 +、- ) 和 数值 (如 42、 Token: Token: 
3. 14) , 即 表示 单词 是 什么 类 别 以 及 保存 单词 的 。 kind: .kind: 
数值 (如 果 有 的 话 ) ， 如 右 图 所 示 。 - : value: 诈 Varue 
在 C++ 代 码 中 有 很 多 方式 来 表示 这 些 类 型 ， 
下 面 是 最 简单 实用 的 一 种 方式 : 


class Token { // a very simple user-defined type 
public: 
char kind; 
double value; 
}; 
Token 是 一 个 类 似 于 int 或 者 char 的 类 型 , 因此 可 用 于 定义 变量 及 值 。 它 有 两 个 部 分 ( 称 为 成 员 ): 
kind 和 value。 关 键 字 class 表示 定义 一 个 “用 户 自 定义 类 型 ", 该 类 型 可 以 有 成 员 , 也 可 以 没有 成 


员 。 第 一 个 成 员 kind 是 一 个 char 字符 , 因此 可 以 方便 地 保存 '+' 和 ' *' 表 示 加 法 和 乘法 。 我 们 可 





以 通过 如 下 方式 进行 类 型 定义 : 
Token t; /tis a Token 
t.kind = '+"; //t represents a + 
Token {2; At2 js another Token 
.kind='B8'; /we use the digit 8 as the “kind” for numbers 
t2.value = 3.14; 


我 们 使 用 成 员 访 问 符号 “object_name. member_name "访问 成 员 ， 可 以 将 t. kind 读 作 。 t 的 kind”, 将 
{2. value 读 作 “已 的 value”。 此 外 ,可 以 像 复制 int 型 对 象 一 样 复制 Token 对 象 : 


Token tt = f; / copy initialization 
if (tt.kind != tkind) error("impossible!"); 
t=2; // assignment 


cout<<t.value; /will print 3.14 


给 定 Token 类 型 ,可 以 将 表达 式 (1.5 +4) * 11 表示 为 如 下 7 个 单词 : 





注意 , 像 ' + 这 种 简单 的 单词 不 需要 值 ; 因此 我 们 不 使 用 它 的 value 成 员 。 我 们 需要 一 个 字符 来 表 
示 单词 “ 数 ”, 由 于 '8' 很 明显 不 是 一 个 运算 符 或 者 标点 符号 , 这 里 选 它 标识 单词 * 数 "。 使 用 '8' 来 表示 
“ 数 ” 有 点 含混 , 但 目前 在 这 样 用 。 
Token 是 C++ 用户 自 定义 类 型 的 一 个 实例 。 一 个 用 户 自 定义 类 型 可 以 有 成 员 晴 数 ( 操作 ) 和 
数据 成 员 , 定义 成 员 函 数 的 理由 有 很 多 。 这 里 仅 提 供 两 个 成 员 晴 数 , 给 出 一 种 初始 化 Token 的 更 
有 效 方 法 : 


class Token { 
public: = 
char kind; // what kind of token 
double value; // for numbers: a vajue 
ee ch)  //make aToken from a char 
:kind(ch), value(0) {} : 
Token(char ch, double val) /makea Token from a char and a double 
:kind(ch), value(val) { } 
}; 


这 两 个 成 员 函 数 比较 特殊 ， 人 它们 与 类 型 具有 相同 的 名 称 ， 用 于 初始 化 
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(“构造 ”)Token 对 象 。 例 如 : 


Token t1(+); // initialize t1: so that ti.kind = '+! , 
Token 12('8',11.5); / initialize t2 so that t2.kind = '8’' and t2.value = 11.5 


在 第 一 个 构造 函数 中 ，:kind(ch) , value(0) 表 示 “ 将 kind 和 value 分 别 初始 化 为 ch 和 0”, 在 第 二 
个 构造 函数 中 , :kind( ch) ,value( val) 表示“ 将 kind 和 value 分 别 初始 化 为 ch 和 val”。 这 两 种 情况 
都 不 需要 其 他 操作 来 构造 该 Token, 因此 函数 体 为 空 : | } 。 这 种 以 冒号 开始 的 特殊 的 初始 化 语法 
(成 员 初 始 化 列表 ) 仅 用 于 构造 函数 中 。 

注意 , 构造 函数 没有 返回 值 , 不 需要 或 者 说 不 允许 有 返回 类 型 。 关 于 构造 函数 的 更 多 介绍 请 
参见 9.4.2 节 和 9.7 节 。 
6. 3.4 使 用 单词 

现在 , 或 许 我 们 能 够 实现 完整 的 计算 器 程序 了 。 然 而 , 可 能 前 面 的 设计 只 有 一 小 部 分 有 用 。 
在 计算 器 程序 中 如 何 使 用 Token? 我 们 可 以 将 输入 读 到 Token .向量 中 : 


Token get token();  //function to read a token from cin 
vector<Token> tok; //we'll put the tokens here 


int main() 
{ 
while (cin) { 
Token t = get_token(); 
tok.push_back(0; 
} 
hi... 
} 


接 下 来 , 我 们 可 以 先 读 取 一 个 表达 式 , 然后 对 其 进行 运算 。 例 如 ， 

对 于 11 * 12 可 以 得 到 右 图 。 我 们 可 以 从 中 找到 乘法 符号 及 其 操作 、 

数 ， 因 此 非常 容易 地 执行 乘法 运算 ,因为 数字 11 和 12 是 作为 数字 

而 不 是 字符 串 存 储 的 。 | 
接 下 来 看 一 个 更 复杂 的 表达 式 , 给 定 1+2 *3, tok 包含 5 个 Token: … 













.+ 付 村 


通过 一 个 简单 的 循环 就 可 以 找到 乘法 操作 符 : 


for (int i = 0; i<tok.size(); ++i) { 
if (tok[i}.kind=='*") { // we found a multiply! 
double d = tok[i-1.value*tok[i+1 .value; 
// now what? 


} 





} . 二 

但 接 下 来 如 何 处 理 乘 积 ,d 呢 ? 如 何 确定 子 表达 式 的 计算 顺序 呢 ? 因为 加 法 运算 符 在 乘法 运算 符 之 
前 , 所 以 不 能 直接 按照 从 左 到 右 的 顺序 计算 。 我 们 可 以 试 试 从 右 到 左 计算 ! 但 这 么 做 对 1+2 *3 是 
正确 的 , 对 1*2+3 又 是 错误 的 了 。 更 糟 的 是 1 +2 * 3 +4, 必须 “由 内 至 外 ”计算 : 1+ (2 *3) +4。 
又 出 现 了 新 的 问题 , 我 们 如 何 处 理 括号 呢 ,最 终 我 们 到 底 应 该 如 何 做 呢 ? 似乎 是 走 进 了 死胡同 。 我 
们 必须 后 退 一 步 ， 先 停止 程序 的 编写 , 重新 考虑 如 何 读 取 和 分 析 输 入 表达 式 , 并 计算 它 的 值 。 

我 们 对 于 此 问题 求解 (编写 计算 器 程序 ) 的 第 一 次 尝试 以 满怀 热情 开始 , 但 现在 已 经 走 到 尽头 
了 。 对 第 一 次 编程 来 说 , 这 是 很 常见 的 。 这 不 是 灾难 , 它 使 我 们 加 深 了 对 这 个 问题 的 理解 。 而 且 
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在 本 例 中 , 这 次 尝试 还 给 我 们 带 来 了 一 个 有 用 的 概念 ; 单词 。 我 们 今后 会 反复 遇 到 (name, value) 
对 这 种 形式 , 单词 是 一 个 很 好 的 实例 。 但 是 , 我 们 必须 确保 这 种 轻率 的 、 无 计划 的 “编码 ”不 会 浪 
费 太 多 时 间 。 正 确 的 做 法 是 ， 在 做 过 分 析 ( 理解 问题 ) 和 设计 (决定 解决 方案 的 整体 结构 ) 以 后 才 
进行 程序 设计 。 
试 一 试 另 一 方面 ， 为 什么 不 能 找 一 个 更 简单 的 方法 来 解决 这 个 问题 ? 这 看 起 来 并 

不 是 那么 困难 。 即 便 尝 试 没有 什么 效果 ， 也 可 以 增进 我 们 对 问题 和 最 终 求 解 方 案 的 理 

解 。 现 在 马上 思考 你 可 以 做 些 什么 。 比 如 对 于 表达 式 12.5 +2, 我 们 可 以 先进 行 单词 划 

分 ， 然 后 确定 表达 式 很 简单 ， 最 终 计算 出 结果 。 这 个 过 程 有 一 点 凌乱 ， 但 它 比较 直接 ， 

或 许 我 们 可 以 沿 着 这 个 思路 继续 前 进 ， 找 到 很 好 的 解决 方法 。 接 着 考虑 这 种 情况 : 在 

2+3*4 中 既 有 + 又 有 * ， 应 该 如 何 处 理 呢 ? 仍然 能 够 通过 “ 变 力 ”方式 处 理 。 但 是 ,对 于 

1+2#+3/4%5 +(6-7*#(8) ) 这 种 更 复杂 的 表达 式 又 如 何 处 理 呢 ? 如 何 处 理 像 2+ 3 

和 2&3 这 样 的 错误 呢 ? 稍微 花 些 时 间 思 考 一 下 ,或 许可 以 在 纸 上 写 点 什么 , 比如 勾勒 一 

下 可 能 的 解决 方案 , 写 出 一 些 有 趣 或 重要 的 输入 表达 式 。 
6. 3.5 重新 开始 

现在 再 看 一 下 问题 , 不 要 急于 得 出 不 完善 的 解决 方案 。 必 须 注 意 , 如 果 这 个 程序 (计算 器 ) 运 
行 后 只 计算 一 个 表达 式 的 值 就 结束 ， 显 然 是 不 满足 要 求 的 。 我 们 希望 程序 的 一 次 执行 能 够 对 知 干 
表达 式 进行 计算 , 因此 改进 伪 代 码 如 下 : 


while (not_finished) { 
read a line 
calculate // do the work 
write_result 


} 
很 明显 程序 变 得 复杂 了 ， 但 想 想 我 们 使 用 计算 器 的 情景 ,你 就 会 意识 到 一 次 做 多 个 运算 是 很 平常 
的 事情 。 难 道 我 们 让 用 户 做 一 次 运算 就 启动 一 次 程序 吗 ? 可 以 ,但 是 在 很 多 现代 操作 系统 上 启动 
程序 的 过 程 比较 慢 , 因此 最 好 不 要 这 样 做 。 
当 我 们 审视 上 面 的 伪 代 码 、 我 们 最 初 的 解决 方案 以 及 我 们 设计 的 使 用 实例 ; 产生 如 下 几 个 问 
题 (其 中 某 些 给 出 了 可 能 的 答案 ) : 
1) 如 果 输 入 表达 式 45 +5/7, 那么 如 何 找 出 其 中 的 个 体 元 素 : 44、+ 、5、/ 和 7? (单词 化 1) 
2) 如 何 标识 表达 式 的 结束 ”当然 是 用 换行 符 ! (要 始终 保持 对 “当然 ”的 怀疑 :“ 当然” 不 是 
一 个 有 说 服 力 的 理由 ) 。 
3) 如 何 将 表达 式 45 +5/7 作为 数据 存储 以 便于 计算 ? 在 计算 加 法 之 前 必须 先 将 字符 4 和 5 
转换 为 整数 45, 即 4* 10 +5。( 因 此 单词 化 是 解决 方案 的 一 部 分 。) 
4) 如 何 保证 表达 式 45 +5/7 的 计算 顺序 为 45 + (5/7) 而 不 是 (45 +5)/7? 
5) 表达 式 5/7 的 值 是 多 少 ? 大 约 是 0.71, 但 这 不 是 一 个 整数 。 根 据 对 计算 器 的 使 用 经 验 可 知 ， 
用 户 往往 会 期 望 得 到 一 个 浮 点 计算 结果 。 我 们 应 该 允许 输入 表达 式 中 出 现 浮 点 数 吗 ? 当然 ! 
6) 可 以 使 用 变量 吗 ? 例如 ， 我 们 能 否 使 用 下 面 的 表达 式 


V=7 
m=9 
v*m 


好 主意 , 不 过 先 放 一 放 , 我 们 还 是 先 实现 计算 器 的 基本 功能 。 
如 何 回答 问题 6 可 能 是 求解 方案 中 最 重要 的 抉择 。 在 7.8 节 , 你 会 看 到 如 果 我 们 决定 实现 变 
量 功 能 , 程序 代码 量 将 会 是 原来 的 两 倍 。 让 最 初版 本 正常 运行 起 来 所 花费 的 时 间 也 将 是 原来 的 两 
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倍 。 以 我 们 的 估计 ,如 果 你 是 一 个 新 手 将 会 付出 四 倍 的 工作 量 , 因而 很 可 能 最 终 放弃 人 急 在 程序 设 
计 早 期 避免 “功能 草 延 "是 很 重要 的 , 应 该 保证 先 构建 一 个 简单 的 版 本 ,只 实现 最 基本 的 功能 。 一 
旦 程序 能 够 运转 , 你 可 以 有 更 大 的 野心 继续 完善 程序 。 分 阶段 实现 一 个 程序 比 一 次 完成 要 简单 得 
多 。 如 果 一 开始 就 实现 变量 功能 还 有 一 个 负面 影响 ; 很 难 抵挡 进一步 添加 “漂亮 特性 ”的 诱惑 。 加 
上 常用 的 数学 函数 如 何 ? 再 加 上 循环 功能 怎么 样 ? 一 旦 开始 便 很 难 停 下 来 。 

从 程序 员 的 观点 来 看 , 问题 1、3 和 4 是 令 人 困扰 的 。 这 几 个 问题 相互 关联 ,因为 一 旦 找到 一 
个 45 或 者 一 个 +，, 我 们 应 该 如 何 进行 处 理 它 们 ? 也 就 是 说 , 在 程序 中 如 何 存储 它们 ? 很 明显 , 单 
词 化 是 整个 解决 方案 的 一 部 分 , 但 仅仅 是 一 部 分 而 已 。 

一 个 有 经 验 的 程序 员 如 何 应 对 这 些 问题 ? 当面 对 一 个 棘手 的 技术 问题 时 , 通常 都 有 一 个 标准 
答案 。 我 们 知道 ,从 计算 机 能 够 通过 键盘 接收 符号 输入 开始 ,人 们 就 已 经 开始 编写 计算 器 程序 
了 。 至 少 已 经 有 50 年 的 历史 了 , 因此 肯定 有 很 成 熟 的 解决 方案 。 在 这 种 情况 下 ,有 经 验 的 程序 员 
就 会 咨询 同事 、 查 阅 文献 。 和 希望 猛 冲 猛 冯 ,一夜 之 间 打破 50 年 来 的 经 验 是 很 思 愉 的 想法 。 


6.4 文法 


对 于 如 何 理解 表达 式 的 含义 , 已 经 有 标准 的 解决 方法 了 : 首先 读 人 符号 , 将 它们 组 合 为 单词 。 
因此 , 如 果 键 人 
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程序 应 该 产生 如 下 单词 列表 : 


一 个 单词 就 是 一 个 字符 序列 , 用 来 表示 一 个 基本 单元 , 例如 数字 或 者 运算 符 。 

在 产生 单词 之 后 , 我 们 的 程序 必须 保证 对 整个 表达 式 正确 解析 。 例 如 , 我 们 知道 表达 式 45 + 
11. 5/7 的 计算 顺序 是 45 + (11. 547 ) 而 不 是 (45 +11.5)/7, 但 如 何 告诉 程序 这 些 有 用 的 规则 呢 ( 例 
如 , 除法 比 加 法 优先 级 高 )? 标准 的 方法 就 是 设计 一 个 文法 (grammar) 来 定义 表达 式 的 语法 , 然后 
在 程序 中 实现 这 些 文法 规则 。 例 如 : 


/a simple expression grammar: 


Expression: 
Term 
Expression "+" Term  //addition 
Expression "-" Term /subtraction 


Term: 

Primary 

Term ”Primary I multiplication 

Term "/" Primary Wdivision 

Term "%" Primary I remainder (modulo) 
Primary: 

Number 

"(" Expression ")" I grouping 
Number: 


floating-point.-literal 
这 是 一 个 简单 的 规则 集合 , 最 后 一 条 规则 读 作 “ 一 个 Number 是 一 个 浮 点 常量 ”, 倒数 第 二 条 规则 
表明 “一 个 Primary 是 一 个 Number, 或 者 是 '(' 后 接 一 个 Expression 再 接 一 个 ') ”。 针 对 Expres- 
sion 与 Term 的 规则 类 似 , 都 是 依赖 其 后 的 规则 来 定义 。 
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如 6.3.2 节 ,我 们 从 C++ 定义 中 借用 了 如 下 几 类 单词 ; 

e 浮上 点 常量 : 与 C++ 和 定义 相同 , 如 3.14、0. 274e2 和 42 等 

e 运算 符 : + 、- 、* 、/、% 等 

e 括号 :(、) 

从 最 初 的 伪 代 码 到 现在 使 用 单词 和 文法 的 方法 , 在 概念 上 是 一 个 巨大 的 飞 除 。 这 正 是 我 们 所 期 望 
的 那 种 飞 牙 , 但 不 依靠 帮助 一 一 前 人 的 经 验 、 参 考 文献 和 导师 的 指导 是 办 不 到 的 。 

告 看 起 来 , 文法 好 像 根本 没有 意义 , 语法 符号 看 起 来 也 是 如 此 。 然 而 , 请 记 住 它 是 一 种 通用 
的 、 优美 的 符号 (最 终 你 会 体会 到 这 种 符号 的 好 处 ), 实际 上 , 你 在 中 学 时 期 或 更 早 就 有 能 力 使 用 
ee 你 自己 来 计算 1-2*3、1+2-3 和 3*2+4/2 这 样 的 表达 式 , 显然 是 没有 问 

， 如 何 计算 已 经 深 深 印 在 你 的 头脑 中 了 。 但 你 能 解释 你 是 如 何 做 的 吗 ? 你 能 给 一 个 从 未 学 过 
ne 你 的 方法 能 用 来 计算 任意 运算 符 和 运算 数组 合 出 的 表达 式 吗 ? 为 了 
能 清楚 地 表达 计算 方法 , 而 且 足 够 详细 、 足 够 精确 ,能 被 计算 机 所 理解 ,我们 需要 一 种 符号 系 
常规 的 、 强 有 力 的 工具 。 

如 何 来 读 入 一 个 文法 呢 ? 基本 方法 是 这 样 的 : 对 于 给 定 输入 ， 从 “顶层 规则 ”Expression 开始 ， 
搜索 与 输入 单词 匹配 的 规则 。 根 据 文法 读 取 单词 流 的 方式 称 为 语法 分 析 (parse) ,实现 该 功能 的 
程序 称 为 分 析 器 (parser) 或 者 语法 分 析 器 (syntax analyzer)。 语 法 分 析 器 从 左 到 右 读 取 单 词 ， 与 我 
们 输入 和 阅读 的 顺序 一 致 。 下 面 给 出 一 个 非常 简单 的 实例 ; 2 是 一 个 表达 式 吗 ? 

1 ) 一 个 Expression 必须 是 一 个 Term 或 者 以 Term 结尾 , 一 个 Term 必须 是 一 个 Primary 或 者 以 

.Primary 结尾 , 一 个 Primary 必须 以 (或 者 Number 开头 。 很 明显 , 2 虽然 不 是 (, 但 它 是 一 个 

浮 点 常量 型 Number, 因此 它 是 一 个 Primary。 
2) Primary( Number 2) 前 没有 /、* ls , 因此 它 是 一 个 完整 的 Term, 而 不 是 /、* 或 者 % 表 
达 式 的 结尾 。 
3) Term( Primary 2) 前 没有 + 马 或 者 - ， 因 此 它 是 一 个 完整 的 Expression ， 而 不 是 + 或 者 - 表达 
式 的 结尾 。 
因此 , 根据 文法 , 2 是 一 个 表达 式 , 分析 步 又 如 下 所 示 : 








上 面 给 出 了 根据 定义 解析 表达 式 的 方法 , 由 解析 路 径 可 知 2 是 一 个 表达 式 ， 因 为 2 是 一 个 浮 点 党 
量 , 而 一 个 浮 点 常量 是 一 个 Number, 一 个 Number 是 一 个 Primary, 一 个 Primary 是 一 个 Term, 一 个 


Term 是 一 个 Expression。 
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下 面 给 出 一 个 更 复杂 的 实例 : 2 +3 是 一 个 Expression 吗 ? 很 明显 , 许多 推导 过 程 与 分 析 2 时 
一 样 : 

1) 一 个 Expression 必须 是 Term 或 者 以 Term 结尾 ，Term 必须 是 Primary 或 者 以 Primary 结尾 ， 
Primary 必须 以 (开头 或 者 是 Number。 显 然 2 不 是 左 括号 , 而 是 一 个 浮 点 常量 类 型 的 Num- 
ber, 因而 是 一 个 Primary。 

2) Primary( Number 2) 前 面 没 有 /、* 或 者 % ,因此 它 是 一 个 完整 的 Term, 而 不 是 /、* 或 者 % 
表达 式 的 结尾 。 

3) Term( Primary 2) 后 面 跟着 + 运算 符 , 因此 它 是 Expression 第 一 部 分 的 结尾 , 必须 寻找 + 运 
算 符 后 面 的 Term。 与 推导 2 是 一 个 Term 的 方式 一 样 ,3 也 是 一 个 Term。 由 于 3 后 面 没有 
+ 或 -操作 符 , 因此 它 是 一 个 完整 的 Term, 而 不 是 加 / 减 表 达 式 的 一 部 分 。 因 此 ,2+3 符 
合 Expression + Term 规则 ， 因 此 是 一 个 Expression 。 

我 们 还 是 以 图 形 方式 说 明 这 个 推导 过 程 , 为 简化 省 略 了 浮 点 常量 到 Number 规则 的 推导 。 





上 图 给 出 了 根据 定义 分 析 表 达 式 的 路 径 , 由 分 析 路 径 可 知 2+3 是 一 个 Expression，, 因为 2 是 一 个 
Term 类 型 的 Expression, 3 是 一 个 Term, 而 Expression 后 接 一 个 + 再 接 一 个 Term 构成 一 个 Expres- 
我 们 对 文法 感 兴趣 的 真正 原因 在 于 它 可 以 帮助 我 们 正确 地 分 析 同 时 包含 + 和 * 的 表达 式 , 下 
面 看 看 如 何 处 理 45 +11.5*7。 然 而 ,计算 机 利用 上 述 规则 分 析 此 表达 式 的 详细 过 程 是 令 人 乏味 
的 , 因此 我 们 省 略 其 中 一 些 熟悉 的 中 间 步 骤 ,， 如 分 析 2 和 2 +3 的 过 程 。 很 明显 , 45、11.5 和 7 都 
是 浮 点 常量 ,因而 都 是 Number， 也 都 是 Pimary， 因 此 我 们 忽略 了 所 有 Primary 之 下 的 规则 。 于 
是 有 : 
1)45 是 一 个 Expression, 后 面 紧 跟 一 个 + ， 因 此 需要 寻找 一 个 Term, 以 便 实 现 Expression + 
Term 文法 规则 。 
2) 11.5 是 一 个 Term, 后面 紧 跟 一 个 * ,因此 需要 找到 一 个 Primary, 匹配 Term * Primary 文法 
规则 。 
3) 7 是 一 个 Primary, 由 Term * Primary 规则 可 知 11.$ * 7 是 一 个 Term。 同 样 , 根据 Expression + 
Term 规则 可 知 , 45 +11.5 * 7 是 一 个 Expression。 特 别 地 ， 这 个 表达 式 需 要 先 算 11.5 * 7 ， 
然后 再 运算 45 + 11.5 *7, 正 像 我 们 所 写 的 45 + (11.5 *7)。 z 
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下 面 给 出 推导 过 程 的 图 示 ( 省 略 了 浮 点 常量 到 Number 规则 的 推导 ) : 


Hr 
共计 
3 





上 面 给 出 了 根据 定义 分 析 表 达 式 的 路 径 。 注 意 ，Term * Primary 规则 表明 了 11. 5 先 与 7 做 乘法 ， 
而 不 是 与 45 做 加 法 运算 。 

你 会 发 现 这 种 方法 在 开始 时 很 难 理 解 , 但 很 多 人 确实 在 阅读 文法 , 而 简单 的 文法 理解 起 来 并 
不 困难 。 然 而 , 我 们 并 不 是 想 教 你 理解 2 +2 或 者 是 45 +11.5 *7。 很 明显 , 你 已 经 知道 这 些 了 。 
我 们 只 是 在 尝试 找到 一 种 让 计算 机 来 “理解 "45 + 11.5 * 7 和 所 有 其 他 更 加 复杂 的 表达 式 的 方法 。 
实际 上 , 复杂 的 文法 并 不 适合 人 们 阅读 , 但 计算 机 却 擅长 这 项 工作 。 让 计算 机 快速 、 准 确 地 遵循 
这 些 规 则 进行 分 析 是 非常 容易 的 。 按 精确 的 规则 工作 本 来 就 是 计算 机 所 擅长 的 。 
6. 4. 1 ”英文 文法 

如 果 你 以 前 从 未 接触 过 文法 ,我 们 希望 你 现在 就 开动 大 脑 。 事 实 上 ， 即 使 你 以 前 曾经 接触 过 
文法 , 现在 还 是 要 开动 脑筋 , 我 们 来 看 下 面 一 个 很 小 的 英文 文法 子 集 : 


Sentence : 


Noun Verb /e.g., C++ rujes 

Sentence Conjunction Sentence  //e.g., Birds fly but fish swim 
Conjunction : 

tand’ 

nopr" 

Hbutr 
Noun : 

"birds" 

nfish™ 

CC 十 十 1 


Verb : 
?rulesy ”i 
"fiy”™ 
"swim" 


一 个 句子 由 语言 的 基本 单元 (例如 名 词 、 动 词 和 连词 ) 构 成 。 根 据 文法 规则 可 以 分 析 一 个 句子 , 确 
定 哪些 字 是 名 词 , 哪些 是 动词 等 。 这 个 简单 的 文法 也 会 产生 一 些 没有 意义 的 句子 , 例如 ,“C ++ 
fy and birds mles”, 但 如 何 修正 这 一 问题 已 超过 本 书 的 范围 。 

许多 人 已 经 在 中 学 或 者 外 语 课 ( 例如 英语 课 ) 上 学 习 过 这 些 文法 规则 了 , 这 些 文法 规则 是 非常 
基本 的 。 实 际 上 , 这 些 规 则 深 深 地 印 在 我 们 的 大 脑 之 中 , 这 也 是 神经 学 所 研究 的 重要 课题 。 
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下 面 来 看 一 下 语法 分 析 树 ， 前 面 我 们 用 它 来 分 析 表 达 式 , 这 里 用 来 描述 简单 的 英语 ; 





这 些 语法 看 起 来 并 不 是 那么 复杂 。 如 果 你 不 理解 6. 4 节 的 内 容 , 你 现在 可 以 回去 头 去 重新 阅读 ， 
经 过 第 二 次 阅读 你 将 会 发 现 很 多 有 用 的 东西 。 
6. 4.2 设计 一 个 文法 

我 们 是 如 何 设 计 出 这 些 表达 式 的 文法 规则 呢 ?“ 经 验 ” 是 最 诚实 的 回答 , 我 们 的 方法 不 过 就 是 
人 们 所 习惯 的 书写 表达 式 文法 的 方法 。 然 而 , 写 一 个 简单 的 文法 还 是 有 一 些 相 当 直 接 的 方法 的 : 


我 们 需要 知道 

1) 如 何 区 分 文法 规则 和 单词 。 

2) 如 何 来 排列 文法 规则 (顺序 )。 

3) 如 何 表 达 可 选 的 模式 (多 选 ) 。 

4) 如 何 表达 重复 的 模式 (重复 )。 

5) 如 何 识别 出 文法 规则 的 开始 。 
不 同 的 教材 与 不 同 的 分 析 程 序 使 用 不 同 的 符号 约定 和 不 同 的 术语 。 例 如 , 一 些 人 习惯 称 单词 为 终 
结 符 (terminal ) ， 称 规则 为 非 终 结 符 (non-terminal ) 或 者 产生 式 (production) 。 我 们 简单 地 将 单词 放 
在 ( 双 ) 引 号 中 与 规则 相 区 分 。 而 文法 第 一 条 规则 为 默认 的 起 始 规则 。 一 个 规则 的 可 选 模式 放 在 


不 同行 中 。 例 如 : 


List: 
nn Sequence oy 
Sequence: 
_Element 
Element " ," Sequence 
Element: 
TA" 
Bs 
因此 上 面 文法 的 含义 是 ,一 个 Sequence 是 一 个 Element, 或 者 是 一 个 Element 后 面 紧 跟 一 个 


Sequence, 并 且 两 者 以 逗号 隔 开 。 一 个 了 ement 是 字母 A 或 是 字母 B。List 是 在 花 括 号 中 的 一 个 
Sequence。 我 们 可 以 生成 如 下 一 些 List( 如 何 生 成 的 ?): 
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{A} 

{B} 

{A,B} 

{A,A,A,A,B } 
但 下 面 这 些 不 是 List( 为 什么 ?) : 

{} 

A 

{A,A,A,A,B 

{A,A,C,A,B} 

{ABC} 

{A,A,A,A,B, } 


上 面 的 文法 规则 不 是 你 在 幼儿 园 中 所 学 过 的 或 是 深 深 印 在 在 你 脑海 中 的 那些 , 但 它们 也 并 非 什么 
高 深 的 学 问 。 参 见 7.4 节 和 7. 8. 1 节 的 例子 , 可 以 看 到 我 们 是 如 何 用 文法 表述 语法 思想 的 。 


6.5 将 文法 转换 为 程序 


现在 有 许多 令 计 算 机 使 用 文法 的 方式 。 我 们 采用 最 简单 的 一 种 方式 是 为 每 个 文法 规则 写 一 
个 盟 数 , 并 且 使 用 自 定 义 类 型 Token 表示 单词 。 实 现 一 个 文法 的 程序 通常 称 为 分 析 器 (parser) 。 
6. 5. 1 实现 文法 规则 

我 们 在 计算 器 程序 的 设计 中 使 用 了 四 个 画 数 , 一 个 孙 数 用 于 读 入 单词 , 其 他 三 个 也 数 分 别 实 
现 文法 的 三 条 规则 : 


get_token() // read characters and compose tokens 
/ uses cin 

expression() /deai with + and — 
// calls term() and getLtoken() 


term() // deal with * / and % 
// calls primary() and get_token() 
Primary() // deal with numbers and parentheses 


// calls expression() and get_token() 
注意 , 每 个 函数 只 处 理 表 达 式 的 一 个 特定 部 分 , 将 其 他 工作 留 给 其 他 函数 , 这 样 可 以 简化 函 
数 的 实现 。 如 同 每 个 人 处 理 自 己 所 擅长 的 问题 , 将 其 他 不 熟悉 的 问题 留 给 同事 完成 一 样 。 
这 些 函 数 应 该 具体 做 什么 呢 ? 每 个 函数 应 该 根据 其 所 实现 的 文法 规则 , 调用 其 他 文法 函数 , 并 利 


用 get_token( ) 获 得 规则 所 需要 的 单词 。 例 如 ， 当 primary ( ) 哺 数 实现 (Expression) 规 则 时 , 它 必须 调用 
get_token() /to deal with ( and ) 
expression() /to deal with Expression 


这 些 语法 分 析 函 数 的 返回 值 应 该 是 什么 呢 ? 这 个 问题 实际 等 价 于 一 一 我 们 想得到 什么 结果 呢 ? 
例如 , 对 于 2 +3，expression( ) 应 该 返回 5。 毕 竟 , 所 有 信息 都 包含 其 中 了 。 这 就 是 我 们 应 该 做 的 ! 
这 样 做 实际 上 回答 了 前 面 列表 中 最 复杂 的 问题 :“ 如 何 表示 45 + 5/7 才 有 利于 计算 它 的 值 ?” 我 们 
在 读 人 表达 式 时 就 计算 它 的 值 , 而 不 是 把 它 的 某 种 表示 形式 存储 到 内 存 中 。 这 个 小 小 的 想法 其 实 
是 一 个 重要 的 突破 ! 我 们 如 果 让 expression( ) 返 回 某 种 复杂 的 形式 , 随后 再 进行 计算 的 话 , 程序 规 
模 会 是 直接 计算 值 的 版 本 的 4 倍 。 直 接 计 算 表 达 式 的 值 会 节省 我 们 80% 左右 的 工作 量 。 

剩 下 的 那个 函数 是 get_token( ) : 由 于 它 只 处 理 单词 , 而 不 是 表达 式 , 因此 它 不 能 返回 一 个 子 
表达 式 的 值 。 例 如 ，+ 和 (不 是 表达 式 。 因 此 , 它 必须 返回 一 个 Token 对 象 。 因 此 有 : 


/ functions to match the grammar rules: 

Token get token()  //read characters and compose tokens 
double expression() // deal with + and — 

double term() // deal with * /, and % 

double primary() // deal with numbers and parentheses 
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6. 5.2 ”表达 式 
下 面 首先 编写 expression( ) , 它 的 文法 规则 如 下 : 
Expression: 
Term 
Expression '+' Term 
Expression 一 Term 


由 于 这 是 我 们 第 一 次 尝试 将 一 组 文法 规则 转换 为 代码 , 将 会 经 历 一 些 不 成 功 的 开始 。 这 是 学 习 一 
种 新 技术 常见 的 过 程 , 我 们 可 以 从 中 学 到 很 多 有 用 的 东西 。 特 别 地 , 通过 观察 相似 代码 段 表现 出 
令 人 吃惊 的 不 同行 为 , 初学 者 可 以 学 到 很 多 。 阅 读 代 码 是 积累 编程 技巧 的 有 效 途 径 。 

6. 5. 2.1 表达 式 : 第 一 次 尝试 

首先 看 一 下 Expression ' +'Term 规则 , 我 们 首先 调用 expression( ) ,然后 寻找 +( 和 一 ), 最 后 
是 调用 term( ) : 


double expression() 


double left = expression(); //read and evaluate an Expression 


Token t = get_token(); I/ get the next token 
switch (t.kind) { I see which kind of token it is 
Case '+': 
return left + term(); I read and evaluate a Term, 
I then do an add 
Case 一 
return left ~ term!(); I read and evaluate a Term, 
I then do a subtraction 
default: 
return left; I/ return the value of the Expression 
} 


} 
这 个 程序 看 起 来 不 错 。 它 几乎 是 文法 的 一 个 简单 眷 写 ， 其 结构 确实 非常 简单 : 首先 读 人 一 个 Ex- 
pression ， 然 后 判断 它 后 面 是 否 跟 着 一 个 ” + "或 者 一 个 ”- ”， 如 果 确 是 这 样 ， 则 再 读 取 Term。 

不 幸 的 是 , 这 里 存在 很 大 问题 。 怎 样 才能 知道 一 个 表达 式 的 结尾 在 何 处 ,以 便于 寻找 一 个 ”+” 
或 者 一 个 ”- " 呢 ? 请 记 住 , 我 们 的 程序 从 左 到 右 读 取 输 入 , 它 不 能 预 取 符 号 来 查看 前 面 是 否 有 “+” 
运算 符 。 事 实 上 , 这 个 expression( ) 函数 只 能 执行 到 第 一 行 代 码 ， 因为 expression( ) 在 一 直 不 停 地 调 
用 自己 , 这 种 情况 称 为 无 限 递 归 (infinite recursion)。 实 际 上 递归 调用 还 是 会 停止 的 , 因为 每 次 调用 
都 会 消耗 一 定 的 内 存 空间 ， 当 计算 机 内 存 被 耗 光 时 , 程序 就 会 退出 。 递 归 的 含义 就 是 程序 调用 自身 ， 
并 不 是 所 有 的 递归 都 是 无 限 的 , 递归 是 一 种 非常 有 用 的 程序 设计 技术 (人 参见 8.5.8 节 )。 

6. 5.2.2 ”表达 式 : 第 二 次 尝试 

既然 如 此 , 我 们 能 做 什么 呢 ? 每 一 个 Term 都 是 一 个 Expression, 但 一 个 Expression 未 必 是 
Term。 也 就 是 说 , 我 们 可 以 从 寻找 一 个 Term 开始 , 但 只 有 在 找到 一 个 ”+ "或 者 一 个 ” - "时 才 算 
寻找 一 个 完整 的 Expression。 例 如 : 


double expression() 
{ 
double left = term!(); I/ read and evaluate a Term 
Token t = get_token(); // get the next token 
switch (t.kind) { I see which kind of token that is 
Case "+': 
return left + expression(); // read and evaluate an Expression, 


// then do an add 
Case '—'; 
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return left ~ expression(); //read and evaluate an Expression, 
/ then do a subtraction 
defauit: 
return left; / return the value of the Term 
} 
} 


实际 上 , 这 个 晒 数 或 多 或 少 是 可 以 正确 运行 的 。 我 们 在 最 终 的 程序 中 测试 过 它 , 它 完全 可 以 分 析 
我 们 输入 的 每 一 个 合法 的 表达 式 , 甚至 还 能 正确 计算 大 多 数 表达 式 的 值 。 例 如 , 对 于 1 +2,， 首先 
读 和 一 个 Term( 值 为 1), 接着 是 一 个 + 运算 符 , 然后 是 一 个 Expression (恰好 是 一 个 值 为 2 的 
Term) , 最 后 计算 出 结果 3。 同 样 , 1 +2 +3 的 计算 结果 为 6。 我们 还 可 以 举 出 很 多 它 可 以 正确 运 
算 的 例子 , 但 我 们 还 是 简洁 些 : 对 于 1 -2 -3, 会 得 到 什么 结果 呢 ? 这 个 expression( ) 困 数 会 把 :1 
作为 一 个 Term 读 人 , 接着 读 人 表达 式 2 -3( 由 Term 2 和 后 面 Expression 3 构成 ), 然后 用 1 减 去 
2 -3 的 值 。 换 句 话说 , 它 计 算 的 是 1-(2-3) 的 值 , 其 计算 结果 为 2( 正 数 2) 。 但 是 , 我 们 在 小 学 
甚至 更 早 就 学 过 1 -2 -3 等 价 于 (1 -2) -3, 其 结果 是 -4( 人 负数 4)。 

因此 , 我 们 得 到 的 是 一 个 看 似 正确 却 不 能 得 到 正确 结果 的 程序 , 这 是 很 危险 的 。 这 个 例子 万 
其 危险 的 地 方 在 于 , 它 能 够 在 很 多 情况 下 给 出 正确 的 结果 。 例 如 , 它 能 计算 出 1+2+3 正确 的 结 
果 6, 因为 1+(2+3) 等 价 于 (1+2) +3。 重 要 的 是 , 从 程序 设计 的 角度 来 看 , 我 们 做 错 了 什么 吗 ? 
每 当 发 现 错误 时 , 我 们 都 应 该 问 自己 这 个 问题 。 这 样 可 以 帮助 我 们 避免 一 而 再 , 再 而 三 地 犯 同样 
的 错误 。 

最 基本 的 做 法 是 阅读 代码 并 猜测 错误 在 哪里 , 但 这 通常 不 是 一 个 好 方法 。 因 为 我 们 必须 理解 
程序 代码 在 做 什么 , 必须 能 解释 它 为 什么 对 有 些 表达 式 计算 正确 , 对 有 些 表达 式 则 计算 错误 。 

错误 分 析 通 常 也 是 能 找 出 正确 求解 方案 的 最 好 方法 。 在 本 例 中 , 我 们 定义 expression( ) 函数 
如 下 : 先 读 人 一 个 Term, 接着 判断 它 后 面 是 否 有 一 个 + 或 者 一 个 - , 若 有 则 寻找 一 个 Expression。 
实际 上 这 实现 了 一 个 略微 不 同 的 文法 : 


Expression: 
Term 
Term '+' Expression // addition 
Term '~' Expression // subtraction 


这 与 我 们 希望 实现 的 语法 的 不 同 之 处 在 于 , 对 1 -2 -3 这 样 的 表达 式 , 我 们 希望 解释 为 Expression 
1 -2 后 接 -再 接 Term 3, 但 得 到 的 却 是 Term 1 后 接 - 再 接 Expression 2 -3; 也 就 是 说 , 我 们 希望 
1 -2 -3 意味 着 (1 -2) -3, 但 得 到 的 却 是 1 - (2 -3)。 

是 的 , 调试 可 能 是 一 项 非常 乏味 、 棘 手 的 工作 , 也 非常 耗 时 。 但 在 此 例 中 , 我 们 确实 是 在 使 
用 在 小 学 就 学 过 的 、 可 以 帮 我 们 避免 很 多 错误 的 运算 规则 。 洪 在 的 困难 一 一 可 能 出 错 的 地 方 在 于 
我 们 必须 把 这 些 规则 教 给 计算 机 , 但 计算 机 却 不 善于 学 习 这 些 内 容 。 

注意 , 我 们 实际 上 可 以 将 1 -2 -3 定义 为 1 - (2 -3) 而 不 是 (1 -2) -3, 那 我 们 就 不 必 再 讨论 
这 个 问题 了 。 但 这 显然 是 不 行 的 , 我 们 不 能 改变 人 们 习惯 的 算术 运算 规则 。 这 就 是 困难 所 在 : 常 
见 的 程序 设计 难题 ， 多数 是 因为 程序 必须 符合 传统 的 规则 ,而 这 些 规则 早 在 计算 机 出 现 之 前 就 已 
经 建立 起 来 并 被 人 们 所 使 用 了 。 

6. 5.2.3 表达 式 : 幸运 的 第 三 次 

那么 现在 应 该 做 什么 呢 ? 再 次 回顾 一 下 文法 (6. 5.2 节 中 那个 正确 文法 ) : 任何 一 个 Expres- 
sion 都 以 一 个 Term 开始 , Term 后 面 可 以 跟 一 个 + 或 者 一 个 - 。 因 此 , 我 们 必须 先 寻 找 Term, 看 它 
后 面 是 否 有 一 个 + 或 者 一 个 ~-， 并 且 重 复 此 步 又 直到 Term 后 面 没有 加 号 或 者 减 号 为 止 。 例 如 ; 
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double expression0 


{ 
double left = term(); // read and evaluate a Term 
Token t = get_token(); // get the next token 
while (t.kind=='+' || t.kind=='~') { //look fora+ora-— 
if (t.kind == '+') 
left += term(); // evaluate Term and add 
else 
left -= term(); // evaluate Term and subtract 
t= get_token(); 
} 
return left; // finally: no more + or —; return the answer 
} 


这 个 程序 可 能 有 点 混乱 : 我 们 必须 引入 一 个 循环 来 寻找 加 号 与 减 号 。 而 且 , 这 里 还 有 一 些 重复 工 
作 : 对 + 和 -的 测试 进行 了 两 次 ，get_token( ) 函数 也 被 调用 了 两 次 。 这 样 导致 程序 的 逻辑 变 得 有 
所 混乱 ,下 面 我 们 修改 程序 , 去 掉 对 + 和 -的 重复 测试 。 


double expression() 
{ 
double left = term(); // read and evaluate a Term 
Token t= get_token(); // get the next token 
while(true) { 
switch(t.kind) { 
Case 十 ; 
left += term(); // evaluate Term and add 
t= get_token(); 
break; 
Case :一 : 
left -= term(); // evaluate Term and subtract 
t= get_token(); 
break; 
default: 
return left; /finally: no more + or -; return the answer 
} 
} 
} 


注意 , 除了 循环 , 该 程序 与 第 一 次 尝试 的 程序 非常 相似 (参见 6. 5.2. 1 节 )。 我 们 所 做 的 就 是 用 循 
环 语句 蔡 代 了 expression( ) 中 对 自身 的 调用 。 换 句 话说 , 我 们 把 Expression 文法 规则 中 的 Expres- 
sion 转换 为 循环 语句 , 在 循环 语句 中 寻找 后 接 + 和 - 的 Term。 
6.5.3 项 

Term 的 文法 规则 与 Expression 规则 非常 相似 ;: 


Term: 
Primary 
Term ”Primary 
Term ”Primary 
Term '%’ Primary 


因此 , 它们 的 代码 基本 相同 。 下 面 是 第 一 次 尝试 : 
double termO 
{ | 
double ieft = primary(); 
Token t = get_token(); 
while(true) { 
switch (t.kind) { 
case di 
left *= primary(); 
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t= get_token(); 
break; 

Case /': 
[eft /= primary(); 
t= get_token(); 
break; 

Case '%': 

left %= primary(); 

t= get token(); 
break; 

default: 
return left; 

} 

} 
} 


不 幸 的 是 , 程序 没有 编译 成 功 : 编译 器 给 出 了 错误 信息 一 一 C++ 对 浮 点 数 没有 定义 模 运算 (% )。 
当 我 们 回答 前 面 列 出 的 第 五 个 问题 时 “我 们 应 该 允许 输入 表达 式 中 出 现 浮 点 数 吗 ?”, 我 们 做 出 了 
肯定 的 回答 “当然 !”, 实际 上 我 们 当时 并 没有 全 面 考虑 这 个 问题 ,从 而 陷 人 了 功能 蔓延 的 困境 。 
这 种 情况 经 常会 发 生 ! 那么 我 们 应 该 如 何 处 理 呢 ? 我 们 可 以 在 运行 时 检查 运算 符 % 的 两 个 运算 
数 是 否 为 整数 , 若 不 是 则 给 出 错误 信息 ; 或 者 简单 地 将 操作 符 % 排除 在 外 , 本 书 中 就 选择 这 种 简 
单方 法 。 我 们 可 以 随时 将 运算 符 多 加 进来 (参见 7.5 节 ) 。 

在 去 掉 运算 符 % 以 后 ,函数 能 够 正常 运行 了 , 能 够 正确 分 析 Term 并 进行 计算 。 然 而 , 有 经 验 
的 程序 员 会 注意 到 tern( ) 中 存在 一 个 不 可 接受 的 情况 。 如 果 我 们 输入 2/0 会 发 生 什么 情况 ? 
C++ 程序 中 零 不 能 作为 除数 , 否则 计算 机 硬件 会 检测 出 这 一 情况 , 并 终止 程序 , 给 出 一 些 无 用 的 
错误 信息 。 一 个 新 手 很 难 发 现 问题 在 哪里 , 所 以 , 最 好 在 程序 中 检查 这 种 情况 并 给 出 一 个 恰当 的 
错误 提示 


double term() 


double left = primary(); 
Token t= get_token(); 
while(true) { 
switch (t.kind) { 
Case '*': 
left *= primary(); 
t= get_token(); 
break; 
case /': 
{ doubled = primary(); 
if (d == 0) error("divide by zero"); 
left /= d; 
t= get_token(); 
break; 
} 
default: 
return left; 


} 


} 
} 


为 什么 我 们 把 处 理 / 的 语句 放 人 一 个 语句 块 内 呢 ? 这 是 编译 器 规定 的 , 如 果 要 在 swtich 语句 中 定 
义 和 初 始 化 变量 , 必须 把 它们 放 在 一 个 语句 块 内 。 
6. 5. 4 基本 表达 式 

基本 表达 式 的 文法 规则 也 很 简单 : 
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Primary: 
Number 
'(' Expression 小 


它 的 实现 代码 有 点 混乱 , 因为 其 中 有 很 多 可 能 导致 语法 错误 的 地 方 : 


double primary() 

{ 
Token t = get_token(); 
Switch (t.kind) { 


case '(': /handle '( expression 小 
{ double d = expression(); 
t= get_token(); 
if (t.kind 1= ")") error("')' expected"); 


return d; 
) 
case '8': // we use '8 to represent a number 
return t.value; j return the numbers value 
default: 


error("primary expected"); 
} 
} 


基本 上 , 与 expression( ) 和 term( ) 天 数 相 比 并 没有 什么 新 内 容 。 我 们 使 用 了 相同 的 语言 指令 、 相 
同 的 单词 处 理 方式 以 及 相同 的 编程 技巧 。 


6.6 试验 第 一 个 版 本 


为 了 执行 这 些 计 算 髓 了 消 数 , 需要 实现 get_token( ) 函数 并 提供 一 个 main( ) 函数 。main( ) 函数 
比较 简单 ,仅仅 用 于 expression( ) 函数 的 调用 和 结果 输出 。 : 


int main() 
try《 
while (cin) 
cout << expression() << "\n'; 
keep_window_open(); 
} 
catch (exception& e) { 
cerr << e.what() << endl; 
keep_window_open (); 


return 1， 

} 

catch (...) { 
Cerr << "exception \n"; 
keep_window_open (); 
return 2; 

} 


错误 处 理 部 分 还 是 老 样 式 ( 参 见 5. 6. 3 节 ) 。 我 们 把 get_token( ) 函数 的 实现 留 到 6. 8 节 介 绍 , 这 里 
只 是 用 它 来 测试 计算 器 程序 的 第 一 个 版 本 。 
试 一 试 计算 器 程序 的 第 一 个 版 本 (包括 get_token( ) ) 在 文件 calculator00. cpp 中 。 
请 尝试 编译 、 运行 它 , 并 验证 结果 。 

不 出 所 料 , 计算 器 程序 的 第 一 个 版 本 并 没有 很 好 地 按 我 们 期 望 的 方式 来 工作 。 于 是 我 们 不 禁 要 问 
“ 它 为 什么 不 按 我 们 期 望 的 方式 工作 呢 ?” 或 者 更 进一步 ,“ 它 为 什么 像 这 样 工作 呢 ?” 以 及 “ 它 能 做 
什么 呢 ?” 我 们 输入 数字 2 并 换行 ,程序 没有 反应 。 再 敲 一 个 换行 来 看 看 程序 是 否 进入 睡眠 状态 
了 ,仍然 没有 反应 。 接 着 输入 数字 3 并 换行 , 程序 还 是 没有 反应 ! 再 输入 数字 4 接着 换行 , 程序 
终于 给 出 一 个 应 答 21 此 时 屏幕 显示 如 下 : | 
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2 
3 
4 
2 


接着 继续 输入 5 +6, 程序 输出 5， 此 时 屏幕 显示 如 下 : 
2 


6 


全 


除非 你 以 前 有 过 编程 经 验 , 否则 你 多 半 会 陷入 深 深 的 迷惑 之 中 ! 事实 上 ,即使 是 一 个 有 经 验 的 程 
序 员 对 此 也 可 能 感到 迷惑 。 接 下 来 该 如 何 处 理 呢 ? 这 时 你 应 该 尝试 结束 程序 。 但 应 该 如 何 结束 程 
序 呢 ? 我 们 没有 在 程序 中 设置 结束 命令 , 但 一 个 错误 可 以 导致 程序 结束 运行 。 因 此 , 你 可 以 输入 
一 个 x, 程序 会 输出 Bad token 然后 结束 运行 。 终 于 有 这 人 么 一 次 , 程序 能 按 我 们 的 设想 工作 了 ! 

但 是 , 我 们 忘记 将 屏幕 上 的 输入 与 输出 信息 加 以 区 分 了 。 在 解决 主要 问题 之 前 ， 让 我 们 先 对 
输出 做 些 改动 , 易于 呈现 出 程序 做 了 什么 事情 。 我 们 在 输出 内 容 前 增加 一 个 =, 将 其 与 输入 信息 
区 分 开 来 : 

while (cin) cout << "=" << expression() << nm; /version 1 


现在 , 重新 输入 与 上 一 次 运行 完全 一 样 的 符号 , 我 们 得 到 如 下 结果 : 


Bad token 
很 奇怪 ! 我 们 试 着 理解 程序 做 了 些 什 么 。 我 们 还 尝试 了 另外 几 个 例子 , 但 还 是 集中 精力 看 看 这 个 
例子 , 下 面 几 点 令 人 迷惑 不 解 : 

第 一 次 输入 2、3 并 换行 以 后 , 为 什么 程序 没有 反应 呢 ? 

在 输入 4 以 后 , 为 什么 程序 输出 的 是 2 而 不 是 4 呢 ? 

在 输入 5+6 以 后 ,为 什么 程序 回答 的 是 5 而 不 是 11 呢 ? 

产生 这 些 奇怪 的 结果 有 很 多 可 能 的 原因 , 其 中 一 些 将 在 第 7 章 详细 讨论 , 这 里 我 们 只 是 简单 
思考 。 程 序 会 产生 算术 运算 错误 吗 ? 这 几乎 是 不 可 能 的 。 但 确实 绪 果 是 错误 的 : 输入 4 的 结果 不 
应 该 是 2, 5 +6 的 结果 是 11 而 不 应 该 是 5。 我 们 再 试 着 输入 1 23 4+56+78+9 10 11 12 然后 换 


行 , 看 看 会 出 现 什么 结果 。 我 们 将 得 到 : 

1234+56+7 8+9 10 11 12 

| 

二 入 

‘=6 

=8 

=10 
哈 ! 没有 输出 2 或 者 3, 而 且 为 什么 输出 4 而 不 是 9(4 +5) 呢 ?为 什么 输出 6 而 不 是 13(6 +7) 呢 ? 
仔细 观察 : 程序 在 每 三 个 单词 中 输出 一 个 ! 是 不 是 程序 “ 吃 掉 ” 了 一 些 字符 而 没有 让 它们 参加 运算 


呢 ? 确实 是 这 样 ,考虑 expression( ) 函数 : 
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double expression() 


double left = term(); I read and evaluate a Term 
Token t = get_token/(); // get the next token 
while(true) { 
switch(t.kind) { 
Case "十 
left += term(); I evaluate Term and add 
t= get_token(); 
break; 
Case —': 
left -= term(); I evaluate Term and subtract 
t= get_token(); 
break; 
default: 
return left; I finally: no more + Or 一 return the answer 
} 
} 
} 


当 get_token( ) 返 回 的 单词 不 是 ' +' 或 者 ' -' 时 , 我们 简单 地 从 expression( ) 函数 返回 了 。 我 们 没有 
使 用 那个 单词 , 也 没有 把 它 保存 下 来 用 于 后 面 的 计算 。 这 是 不 明智 的 做 法 , 甚至 没有 判断 单词 是 
什么 就 把 它 丢 弃 的 做 法 不 是 一 个 好 主意 。 快 速 查 看 一 下 可 以 发 现 , term( ) 函数 中 也 存在 同样 的 问 
题 。 这 就 解释 了 我 们 的 计算 右 为 什么 会 每 处 理 一 个 单词 后 就 会 “ 吃 掉 " 后 面 的 两 个 。 

我 们 来 修改 expression( ) 函数 , 使 其 不 再 “ 吃 掉 " 单 词 。 那 么 当 程 序 不 需要 下 一 个 单词 (t) 时 ， 
应 该 把 它 放 在 哪儿 呢 ? 我 们 可 以 给 出 很 多 复杂 精巧 的 方案 , 但 在 此 选择 最 显而易见 的 一 种 (你 一 
看 到 这 个 方法 就 会 知道 它 确实 显而易见”) : 如 果 其 他 某 个 函数 需要 使 用 该 单词 ， 而 此 函数 从 输 
入 流 读 人 单词 的 话 , 我 们 将 该 单词 放 回 输入 流 , 它 就 能 够 再 次 被 此 函数 读 取 ! 实际 上 , 我 们 是 可 
以 把 字符 退回 标准 输入 流 istream 中 的 , 但 那 不 是 我 们 真正 想 要 的 。 我 们 希望 的 是 处 理 输入 的 单 
词 , 而 不 是 把 输入 流 变 得 混乱 。 我 们 需要 的 是 一 个 专门 用 于 单词 处 理 的 输入 流 , 能 够 将 已 经 读 出 
的 单词 重新 放 回 去 。 

假设 我 们 已 经 有 一 个 称 为 ts 的 单词 流 “Token_stream”, 并 假设 Token_stream 的 成 员 函 数 get( ) 
用 于 返回 下 一 个 单词 , 成 员 函 数 putback(t) 用 于 将 单词 t 放 回 单词 流 。 一 旦 了 解 了 如 何 使 用 单词 
流 之 后 , 我 们 将 在 6.8 节 实 现 Token_stream。 给 定 了 Token_stream, 我 们 可 以 重 写 expression( ) 函 
数 , 令 其 将 不 使 用 的 单词 放 回 Token_stream。 


double expression() 
{ 
double left =term(); /read and evaluate a Term 
Token t = ts.get(); // get the next Token from the Token stream 


while(true) { 

switch(t.kind) { 

Case ‘+': 
left += term(}); evaluate Term and add 
t= ts.get(); 
break; 

CAaSE 一 : 
left ~= termi(); I evaluate Term and subtract 
t= ts.get(); 
break; 

default: 
ts.putback(t); /putt back into the token stream 
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return left; / finally: no more + or ~; return the answer 
} 
} 
} 
为 外 ,必须 对 term( ) 函数 做 同样 的 修改 : 
double term() 
{ 
double left = primary(); 
Token t = ts.get(); // get the next Token from the Token stream 
while(true) { 
switch (tkind) { 
case ?1 
left "= primary(); 
t= ts.get(); 
break; 
case '/': 
{ double d= primary(); 
if (d == 0) error("divide by zero"); 
left /= d; 
t= ts.get(); 
break; 
} 
default: 
ts.putback(t);  / putt back into the Token stream 
return left; 
} 
} 
} 


对 最 后 一 个 分 析 函 数 primary( ) , 只 需要 把 get_token( ) 函数 改 为 ts. get( ) , primary( ) 函数 使 用 它 读 
人 的 每 一 个 单词 。 


6.7 试验 第 二 个 版 本 


现在 , 我 们 准备 测试 程序 的 第 二 个 版 本 。 输 入 2 并 换行 以 后 , 程序 没有 输出 , 再 次 换行 程序 
仍然 没有 输出 。 输 入 3 并 换行 以 后 程序 输出 2, 输入 2+2 并 换行 以 后 程序 输出 结果 3。 此 时 屏幕 


上 显示 : 
2 


3 

二 2 

2+2 

=3 

由 此 可 知 , 也 许 在 expression( ) 和 term( ) 中 使 用 putback( ) 并 没有 解决 问题 。 下 面 做 为 一 个 
测试 : 

2342+32*3 

=2 

=3 

二 4 

=5 


程序 给 出 了 正确 的 结果 ! 但 最 后 一 个 结果 (6) 却 不 见 了 。 这 里 仍然 存在 一 个 单词 预 读 方面 的 问 
题 。 但 是 , 这 次 的 问题 不 是 我 们 的 程序 “ 吃 掉 ” 了 字符 , 而 是 它 不 能 返回 表达 式 的 运算 结果 ,除非 
再 输入 后 续 表达 式 。 也 就 是 说 , 一 个 表达 式 的 结果 不 是 被 立即 输出 , 而 被 推迟 到 程序 读 入 下 一 个 
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表达 式 的 第 一 个 单词 以 后 才 输 出 。 不 幸 的 是 , 只 有 在 输入 下 一 个 表达 式 并 回 车 以 后 , 程序 才能 读 
到 那个 单词 。 程 序 本 身 没 有 错误 ,只 是 它 的 输出 有 些 延 迟 。 

如 何 改进 这 个 问题 ? 一 个 很 明显 的 方法 是 加 入 一 个 “输出 命令 ”。 我 们 使 用 分 号 标识 一 个 表 
达 式 的 结束 并 触发 结果 的 输出 。 男 外 , 我 们 再 增加 一 个 “退出 命令 ”, 实现 程序 的 正常 退出 。 字 符 
q( 表示“ quit” ) 用 于 表示 退出 命令 是 很 恰当 的 。 在 原来 版 本 的 main( ) 函数 中 ,有 


while (cin) cout << "=" << expression() << \n'’; /version]1 


我 们 把 它 改 成 下 面 这 样 , 可 能 有 点 复杂 , 但 却 更 加 实用 : 


double val = 0; 
while (cin) { 
Token t = ts.get(); 


if (t.kind == 'q') break; HA 'q' for “quit” 


if (t.kind == ';") // ';' for “print now” 
Cout << "=" << val << \n'; 

else 
ts.putback(t); 


val = expression(); 


} 
现在 的 计算 需 程 序 真正 可 用 了 。 例 如 : 


现在 , 我 们 有 了 一 个 比较 好 的 计算 右 程 序 的 初步 版 本 。 虽 然 还 不 是 我 们 最 终 想 要 的 那样 , 但 是 可 
以 把 它 作 为 进一步 完善 的 基础 。 重 要 的 是 , 现在 的 版 本 可 以 正常 运行 , 然后 就 可 以 逐步 改进 问 
题 、 增 加 功能 , 并 在 这 个 过 程 中 一 直 保 持 一 个 能 正常 运行 的 版 本 。 


6.8 单词 流 


在 改进 计算 器 程序 之 前 , 我 们 先 给 出 Token_stream 的 实现 。 毕 竟 , 程序 在 没有 获得 正确 输入 
之 前 是 不 能 正确 运行 的 。 因 此 , 我 们 首先 实现 Token_stream, 但 并 不 是 想 偏离 计算 器 程序 这 个 主 
题 太 远 ， 只 是 首先 完成 一 个 尽量 小 的 可 用 程序 。 

计算 器 程序 的 输入 是 一 个 单词 序列 , 如 (1.5 +4) * 11( 参 见 6.3.3 节 ) 。 我 们 需要 从 标准 输入 
cin 中 读 人 字符 , 并 且 能 够 向 程序 提供 运行 时 需要 的 下 一 个 单词 。 另外, 我 们 发 现 计算 器 程序 经 
常 多 次 读 和 一 个 单词 ， 因此 应 该 把 它们 保存 起 来 便于 后 续 使 用 。 这 是 最 典型 也 是 最 基本 的 功能 ， 
当 严 格 从 左 到 右 读 人 1.5 +4 时 , 在 没有 读 人 + 之 前 , 你 如 何 判 断 浮 点 数 1.5 已 经 完整 读 和 人 了 呢 ? 
实际 上 , 在 遇 到 + 之 前 , 我 们 完全 有 可 能 是 在 读 和 人 1.55555 而 不 是 1.5 的 过 程 中 。 因 此 , 我 们 需 
要 一 个 “ 流 ”， 当 我 们 需要 一 个 单词 时 ,可 以 调用 get( ) 函数 从 流 中 产生 一 个 单词 , 并 且 可 以 利用 
putback( ) 把 单词 放 回 流 中 。 根 据 C++ 的 语法 规则 , 我 们 必须 先 定义 Token_stream 类 型 。 

你 可 能 注意 到 了 前 面 Token 定义 中 的 public:, 那里 使 用 public 并 没有 特别 的 原因 。 但 对 于 
Token_stream， 则 必须 使 用 public 来 限定 相应 的 函数 。C++ 用 户 自 定义 类 型 通常 由 两 部 分 构成 : 
公有 接口 (用 “public:” 标 识 ) 和 具体 实现 (用 "private:” 标 识 ) 。 这 样 做 主要 是 为 了 将 用 户 接口 (用 
户 方便 使 用 类 型 所 需 的) 和 具体 实现 (实现 类 型 所 需 的 ) 分 开 , 希望 没有 对 用 户 的 理解 造成 困难 : 
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class Token_stream { 
public: 
/ user interface 
private: 
/implementation details 
I (not directly accessibje to users of Token_stream) 


}; 
显然 ,我们 经 常 既 扮演 用 户 的 角色 ,又 扮演 实现 者 的 角色 。 但 是 , 弄 清楚 用 户 使 用 的 公有 接口 和 
仅 由 实现 者 使 用 的 具体 实现 之 间 的 区 别 , 对 于 组 织 程序 代码 是 非常 重要 的 。 公 有 接口 应 该 只 包含 
用 户 需 要 的 内 容 ， 比 如 提供 一 组 函数 , 包括 初始 化 对 象 的 构造 永 数 在 内 。 私 有 实现 包括 实现 公有 
盟 数 所 必须 的 内 容 , 包括 用 于 处 理 复杂 细 市 的 数据 和 函数 ,而 这 些 都 是 用 户 不 必 知 道 也 不 应 该 直 
接 使 用 的 。 

下 面 详 细 给 出 Token_stream 类 型 。 用 户 需要 Token_stream 完成 什么 功能 ? 很 明显 , 需要 get( ) 
和 putback( ) 两 个 函数 , 这 也 是 我 们 设计 单词 流 这 个 概念 的 原因 。Token_stream 能 够 从 标准 输入 读 
人 字符 ,从 中 解析 出 单词 , 因此 , 类 中 应 包含 能 创建 Token_stream 对 象 , 并 令 它 能 从 cin 读 和 人 字符 
的 函数 。 于 是 , 最 简单 的 Token_stream 定义 如 下 所 示 : 


class Token_stream { 


public: 
Token_stream(); Amake a Token_stream that reads from cin 
Token get(); / get a Token 
void putback(Token 1); /put a Token back 

private: 


// implementation details 

}; 
这 就 是 一 个 用 户 使 用 Token_stream 所 需要 的 全 部 内 容 。 有 经 验 的 程序 员 可 能 会 对 cin 是 字符 的 唯 
一 输入 源 感到 惊讶 , 但 这 里 我 们 决定 只 从 键盘 输入 字符 , 第 7 章 的 一 个 练习 将 重新 审视 这 个 决定 。 

为 什么 我 们 使 用 了 较 长 的 名 字 putback( ) 而 不 是 put( ) 呢 ? 逻辑 上 看 put( ) 已 经 足够 了 。 我 们 
这 样 做 是 为 了 重点 强调 一 下 get( ) 和 putback( ) 之 间 的 不 对 称 性 , 这 是 一 个 输入 流 , 不 包含 能 用 来 
输出 的 函数 。 在 istream 中 也 实现 了 putback( ) 函数 : 在 系统 中 保持 命名 的 一 致 性 是 比较 重要 的 ， 
有 助 于 记忆 和 避免 不 必要 的 错误 。 

我 们 现在 可 以 创建 、 使 用 Token_stream 对 象 了 : 

Token_stream ts; // a Token_stream called ts 

Tokent=ts.get(0);  //get nextToken from ts 


人 
ts.putback(t); / put the Token t back into ts 


下 面 我 们 要 做 的 就 是 实现 计算 器 程序 的 剩余 部 分 了 。 
6. 8.1 实现 Token_stream 

现在 , 我们 实现 Token_stream 中 的 三 个 函数 。 如 何 表 示 一 个 Token_stream 呢 ? 也 就 是 说 , 需 
要 在 Token_stream 中 存储 什么 数据 才能 完成 相应 的 功能 呢 ? 放 回 Token_stream 的 任何 单词 都 需要 
存储 空间 。 但 为 了 简单 起 见 , 这 里 规定 每 次 只 能 放 回 一 个 单词 ， 对 我 们 的 计算 器 程序 (和 其 他 许 
多 类 似 的 程序 ) 来 说 这 已 经 够 用 了 。 因 此 , 我 们 只 需要 声明 一 个 单词 所 需 的 存储 空间 和 一 个 指示 
该 存储 空间 占用 或 空 的 状态 的 指针 。 


class Token_stream { 


public: 
Token_stream(); /1/ make a Token_stream that reads from cin 
Token get(); // get a Token (get0 is defined elsewhere) 


void putback(Token t); // puta Token back 
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Private: 

boot full; // is there a Token in the buffer? 

Token buffer; //here is where we keep a Token put back using putback() 
}; 


现在 , 我 们 可 以 来 定义 (“编写 ”) 三 个 成 员 函 数 了 , 首先 定义 比较 简单 的 构造 沙 数 和 putback ( ) 
晒 数 。 
在 构造 函数 中 只 需 设 置 fall, 指示 缓冲 区 为 空 即 可 。 


Token_stream::Token_stream() 
:full(false), buffer(0) j no Token in buffer 


{ 
} 


当 我 们 在 类 外 定义 一 个 成 员 时 , 必须 指明 这 个 成 员 属 于 哪个 类 , 为 此 , 需 采 用 如 下 语法 : 

类 名 :: 成 员 名 
在 前 面 的 代码 中 , 我 们 以 这 种 方式 定义 了 Token_stream 的 构造 函数 , 构造 函数 是 一 个 与 类 具有 相 
同名 字 的 成 员 清 数 。 

为 什么 我 们 要 在 类 的 外 部 定义 一 个 成 员 呢 ? 主要 是 为 了 保持 代码 清晰 : 类 的 定义 主要 说 明 类 
能 够 做 什么 。 成 员 函 数 定义 则 指明 如 何 做 , 因此 , 我 们 倾向 于 将 其 放 在 “ 别 的 地 方 ”，， 避 人 免 和 类 定 
义 混在 一 起 分 散 注 意 。 我 们 的 理想 是 , 程序 中 的 每 个 逻辑 实体 都 很 简短 ,能 完整 地 显示 在 屏幕 上 
的 一 页 内 。 如 果 将 成 员 函 数 定 义 放 在 别处 , 是 能 做 到 这 点 的 , 但 如 果 将 其 放 在 类 的 定义 中 (“类 
内 ”成 员 函 数 定义 ), 将 很 难 满足 这 个 要 求 。 

我 们 使 用 成 员 初 始 化 表 来 初始 化 类 的 成 员 ( 参见 6.3.3 节 ) : full(false) 将 Token_stream 的 成 员 
full 设置 为 false， buffer(0) 使 用 “ 哑 单 词 ”( dummy token) 来 初始 化 成 员 buffer, 哑 单 词 是 我 们 设计 
的 专门 用 于 此 处 的 初始 化 的 。6. 3. 3 节 中 Token 的 定义 要 求 每 个 Token 对 象 必须 被 初始 化 ,， 因此 
不 能 忽略 Token_stream :: buffer。 

putback( ) 成 员 函 数 的 功能 是 将 其 参数 放 回 Token_stream 的 缓冲 区 中 : 

void Token_stream::putback(Token t) 

buffer =t; /copy tto buffer 


fuli = true; /buffer is now full 


} 
关键 字 void 指出 putback( ) 函数 不 返回 任何 值 。 如 果 我 们 想 确认 不 发 生 这 种 情况 : 连续 两 次 调用 
putback( ) 盟 数 , 期间 没有 用 get( ) 读 取 放 回流 的 内 容 ， 本 


void Token_stream::putback(Token ft) 

{ 
if (full) error("putback() into a fuli buffer ); 
buffer=t; /copyttobuffer 
fuli = true; /bufferis now full 


} 
对 full 的 测试 用 来 检查 前 置 条 件 “ 缓 冲 区 中 没有 单词 ”。 
6. 8.2 读 单 词 

所 有 的 读 人 操作 都 是 get( ) 函数 完成 的 , 如 果 在 Token_stream :: buffer 中 没有 单词 ，get( ) 函数 
必须 从 cin 读 人 字符 并 将 它们 组 成 单词 : 

Token Token_stream::get() 

{ 


if (fulD) { // do we already have a Token ready? 
// remove Token from buffer 
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fuli=false; 
return buffer; 
} 
char ch; 


cin>>ch; /note that >> skips whitespace (space, newline, tab, etc.) 


switch (ch) { 
Case ;': H for “print” 
Case 'q': H for “quit” 


Case '(': Case )': Case '+': case '~': Case '*': case '/': 
return Token(ch); // let each character represent itself 
Case '.': . 
case '0'; case '1': Case '2': Case '3'; case '4': 
case '5': case '6': case ‘7': Case '8': case '9': 


{ cin.putback(ch); / put digit back into the input stream . 
double val; 
cin >> val; / read a floating-point number 
return Token('8',val); /jet '8' represent “a number” 

} 

default: 
error("Bad token"); 

} 


} 
下 面 我 们 详细 分 析 一 下 get( ) 函数 。 首 先 检 测 缓冲 区 中 是 否 已 经 有 单词 了 ,如 果 有 就 直接 返回 该 
单词 : 
if (full) { // do we already have a Token ready? 
/ remove Token from buffer 
full=false; 


return buffer; 
} 


只 有 当 full 为 false 时 (表明 缓冲 区 中 没有 单词 ), 我 们 才 需 要 处 理 输入 字符 。 此 时 , 我们 逐个 读 人 
字符 并 进行 适当 的 处 理 , 在 其 中 寻找 括号 、 运算 符 和 数字 , 直到 任何 其 他 字符 我 们 都 将 调用 error( ) 
而 结束 程序 : 


default: 
error("Bad tokenn)， 


error( ) 函数 在 5. 6. 3 节 中 描述 过 , 我 们 将 其 声明 包含 在 std_lib_facilities. h 文件 中 。 
我 们 必须 考虑 如 何 表示 不 同类 型 的 单词 ,也 就 是 说 , 必须 为 kind 成 员 选 择 不 同 的 值 。 为 了 简 
单 起 见 , 也 为 了 易于 调试 , 我们 令 一 个 单词 的 kind 域 就 保存 括号 、 运 算 符 本 身 。 这 使 得 括号 和 和 运 


算 符 的 处 理 异 常 简单 : 
case '(': Case 1)1: case '+': Case '—': Case *': Case /: 
return Token(ch); // let each character represent itself 


坦率 地 讲 , 我 们 在 第 一 个 版 本 中 忘记 了 处 理 表示 打印 的 ';' 和 表示 退出 的 'q' 这 两 个 符号 , 我 们 在 
第 二 个 版 本 中 将 这 部 分 代码 添加 进来 。 : 
6. 8. 3 读数 值 

现在 , 我 们 必须 处 理 数值 , 事实 上 这 不 是 一 件 容易 的 事 。 如 何 获 得 123 这 个 数值 呢 ? 当然 ， 
它 可 由 100 +20 +3 得 来 , 但 12.34 又 如 何 获 得 呢 ? 另外 , 我 们 应 该 允许 使 用 科学 计数 法 (如 
12. 34e5 ) 吗 ? 为 了 正确 实现 这 些 功能 ,可 能 需要 花 几 个 小 时 甚至 几 天 时 间 , 地 运 的 是 , 我 们 可 以 
不 必 做 这 个 工作 。 输 入 流 能 够 解析 C++ 文字 常量 , 并 能 将 其 转换 为 double 类 型 的 数值 。 因 此 , 我 
们 所 要 做 的 只 是 如 何在 get( ) 函数 中 告诉 cin 完成 这 些 工 作 而 已 : 
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Case 1 
case ‘0': case '1': case '2': Case '3': case '4': Case '5': Case '6': case 7': 
case 'B':case '9': 


{ cin.putback(ch); I/ put digit back into the input stream 
double val; 
cin >> val; // read a floating-point number 


return Token('8',val); /let '8' represent “a number 
} 


在 某 种 程度 上 , 我 们 是 随意 选择 了 '8 ' 来 表示 “数值 "这 类 单词 。 

那么 , 我 们 如 何 知道 输入 中 出 现 了 一 个 数值 呢 ?” 如 果 根 据 经 验 来 推测 , 或 者 是 参考 C++ 文献 
(如 附录 A)，, 我 们 会 发 现 一 个 数值 常量 必须 以 一 个 阿拉 伯 数 字 或 者 小 数 点 开头 。 因 此 , 我 们 可 以 
在 程序 中 检测 这 些 符号 , 来 判断 是 否 出 现 数值 。 接 下 来 , 我 们 希望 cin 完成 数值 的 读 取 , 但 我 们 已 
经 谈 人 了 第 一 个 字符 (一 个 阿拉 伯 数 字 或 小 数 点 ) 。 因 此 , 我 们 需要 将 第 一 个 字符 的 数值 和 cin 读 
人 的 后 续 字 符 的 值 结 合 起 来 。 例 如 输入 123 , 我 们 会 得 到 1, cin 读 人 23, 我 们 需要 将 100 与 23 相 
加 。 真 是 太 和 党 琐 了 ! 幸运 的 是 (并 不 是 偶然 的 ) ，cin 与 Token_stream 的 工作 方式 类 似 , 也 可 以 把 
已 经 读 出 的 字符 放 回 输入 流 中 。 因 此 , 不 用 做 繁 珊 的 数学 运算 , 我 们 只 需 把 第 一 个 字符 放 回 cin， 
然后 由 cin 读 人 整个 数值 。 

请 注意 , 我 们 如 何 一 次 又 一 次 地 避免 做 复杂 的 工作 , 代 之 以 寻找 简单 的 解决 方案 一 一 通常 是 
全 助 于 C++ 库 。 这 就 是 程序 设计 的 本 质 : 不 断 寻 找 更 简单 的 方法 。 这 与 优秀 的 程序 员 都 是 懒 情 
的 "(看 起 来 有 些 好 笑 ) 不 谍 而 合 。 从 这 个 角度 说 ( 当然 , 也 只 有 从 这 个 角 ), 我 们 应 该 * 懒惰 ”， 如 
果 能 找到 一 个 更 简单 的 方法 , 我 们 何必 写 那 么 多 代码 呢 ? 


6.9 程序 结构 


有 谚语 说 : 只 见 树 木 不 见 森 林 。 同 样 ， 如 果 我 们 只 关心 一 个 程序 中 的 沙 数 、 类 等 , 也 会 失去 
对 程序 的 理解 。 因 此 , 下 面 就 忽略 细节 , 看 看 程序 的 结构 
#include "std _ lib facilities.hn 


class Token {/* ...*/}; 
class Token_siream {/*...*/)}; 


Token_stream::Token_stream() :full(false), buffer(0) {/* ...*/} 
void Token_stream::putback(Token O) {/*...*/} 
Token Token_stream::get() {/*... */} 


Token_stream ts; I/ provides get() and putback!() 

double expression!(); I declaration so that primary() can call expression!) 
double primary0 {/* ... */} // deal with numbers and parentheses 
double term() {/*...*/) I deal with *, /, and % 


double expression() {/*...*/} I deal with + and — 


int main(O) {/* ,.. */} I main loop and deal with errors 
在 这 里 , 声明 的 顺序 是 很 重要 的 , 变量 在 被 声明 之 前 是 不 能 使 用 的 , 因此 ts 必须 在 ts. get( ) 使 用 
之 前 声明 ,error( ) 必须 在 分 析 函 数 之 前 声明 。 在 调用 图 中 有 一 个 非常 有 趣 的 循环 : expression( ) 调 
用 term( ) ,term( ) 调用 primary( ) ，primary( ) 又 调用 了 expression( ) 。 

下 面 是 调用 关系 的 图 描述 ( 由 于 所 有 的 函数 都 调用 error( ) ,因此 将 其 省 略 ) 。 

这 就 意味 着 我 们 不 能 简单 地 定义 这 三 个 困 数 : 没有 任何 一 种 顺序 能 满足 先 定义 后 使 用 的 原 
则 。 因 此 , 至 少 有 一 个 函数 必须 先 只 给 出 声明 而 非 定义 。 我 们 选择 先 声 明 expression( ) 函数 , 这 种 





方式 称 为 前 置 声明 (forwarq declare ) 。 

现在 的 计算 器 程序 已 经 能 正常 工作 了 吗 ? 在 某 种 程度 上 确实 可 以 了 。 它 可 以 正常 编译 、 运 
行 、 正 确 计算 表达 式 , 并 给 出 适当 的 错误 信息 。 但 它 是 按照 我 们 所 希望 的 方式 工作 吗 ? 答案 并 不 
出 人 意料 一 一 它 并 不 能 真正 按 我 们 的 意图 工作 。6. 6 节 给 出 了 程序 的 第 一 个 版 本 并 消除 了 一 个 严 
重 的 错误 , 6.7 节 中 的 第 二 个 版 本 并 没有 多 少 改 进 。 但 这 没有 关系 , 这 是 意料 之 中 的 。 我 们 本 来 
的 目标 就 是 写 一 个 可 以 运行 的 程序 , 能 用 来 验证 我 们 的 基本 思路 ， 从 中 获得 反馈 , 对 于 这 个 目标 
来 说 现在 的 版 本 已 经 足够 好 了 。 从 这 个 角度 来 说 , 它 是 成 功 的 , 但 试 一 下 , 它 仍然 存在 很 多 问题 ! 

试 一 试 ”编译 、 运 行 上 面 设计 的 计算 器 程序 , 看 看 它 能 完成 什么 功能 ， 并 指出 它 为 
什么 会 如 此 工作 。 


所》 简单 练习 


本 练习 对 一 个 有 很 多 错误 的 程序 进行 一 系列 改进 , 使 其 变 得 更 加 有 用 。 
1. 编译 文件 calculator02buggy. cpp 中 的 计算 器 程序 , 你 需要 找到 并 修正 一 些 错误 , 才能 使 程序 编译 通过 , 这 
些 错 误 本 书 中 并 未 涉及 。 
2. 把 用 于 控制 程序 退出 的 命令 符 q 换 成 x。 
3. 把 用 于 控制 程序 输出 的 命令 符 ; 换 成 =。 
4. 在 main( ) 畏 数 中 增加 一 条 欢迎 信息 : 


“Welcome to our simple calculator. 
Please enter expressions using floating-point numbers,” 


$. 改进 欢迎 信息 , 提示 用 户 可 以 使 用 哪些 运算 符 , 以 及 如 何 输出 结果 和 退出 程序 。 

6. 找 出 并 改正 calculator02buggy. cpp 计算 器 程序 中 存在 的 三 个 不 太 明 显 的 逻辑 错误 , 使 计算 器 能 够 产生 正确 
结果 。 

过》 思考 是 

1.“ 程 序 设计 就 是 问题 理解 ”的 含义 是 什么 ? 

2. 本 章 详细 讲述 了 计算 器 程序 的 设计 , 简要 分 析 计 算 器 程序 应 该 实现 哪些 功能 ? 

3， 如 何 把 一 个 大 问题 分 解 成 一 系列 易于 处 理 的 小 问题 ? 

4. 为 什么 编写 一 个 程序 时 ， 先 编写 一 个 小 的 , 功能 可 控 的 版 本 是 一 个 好 主意 ? 

5. 为 什么 功能 蔓延 是 不 好 的 ? 

6. 软件 开发 的 三 个 主要 阶段 是 什么 ? 

7. 什么 是 “用 例 ”? 

8. 测试 的 目的 是 什么 ? 

9. 根据 本 章 的 描述 ， 比较 Term、Expression 、Number 和 Primary 的 不 同 点 。 

10. 在 本 章 中 , 输入 表达 式 被 分 解 为 Term、Expression 、Number 和 Primary 等 组 成 部 分 , 试 按 这 种 方式 分 析 表 
达 式 (17 +4)/(5 -1) 的 构成 。 
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11. 为 什么 程序 中 没有 名 为 number( ) 的 函数 ? 

12. 什么 是 单词 ? 

13. 什么 是 文法 ? 文法 规则 是 什么 ? 

14. 什么 是 类 ? 类 的 作用 是 什么 ? 

15. 什么 是 构造 晴 数 ? 

16. 在 expression( ) 畏 数 中 , 为 什么 switeh 语句 的 默认 处 理 是 退回 单词 ? 

17. 什么 是 “ 预 读 取 ”? 

18. putback( ) 除数 的 功能 是 什么 ”为 什么 说 它 是 有 用 的 ? 

19. 在 term( ) 函数 中 , 为 什么 难以 实现 取 模 运算 符 % ? 

20. Token 类 的 两 个 数据 成 员 的 作用 是 什么 ? 

21. 为 什么 把 类 的 成 员 分 成 private 和 public 两 种 类 型 ? 

22. 对 于 Token_stream 类 ， 当 缓冲 区 中 有 一 个 单词 时 , 调用 get( ) 艺 数 会 发 生 什么 情况 ? 
23. 在 Token_stream 类 的 get( ) 画 数 中 ,为 什么 在 switeh 语句 中 增加 了 对 '; ' 和 'q' 的 处 理 ? 
24. 应 该 从 什么 时 候 开 始 测试 程序 ? 

25.“ 用 户 自 定义 类 型 "是 什么 ? 我 们 为 什么 需要 这 种 机 制 ? 

26. 对 于 一 个 C++“ 用 户 自 定义 类 型 ", 其 接口 是 什么 ? 


7. 我 们 为 什么 要 依赖 代码 库 ? 
人 术语 
类 成 员 接口 public 数据 成 员 成 员 肾 数 语法 分 析 
设计 语法 分 析 咽 单词 被 0 除 pnivate 用 例 


全) 习题 


1. 如 果 你 尚未 做 本 章 “ 试 一 试 ” 中 的 练习 , 现在 就 做 一 下 。 

2. 在 程序 中 增加 对 {| 的 处 理 , 令 其 与 ( ) 作 用 一 致 , 这 样 ，{ (4+5) *6}/(3 +4) 就 是 一 个 合法 的 表达 式 。 

3. 在 程序 中 增加 对 阶乘 运算 符 (用 ! 表示 ) 的 处 理 , 例如 , 表达 式 71 表示 7*6*5*4*3*2*1。 阶 乘 的 优 
先 级 高 于 * 和 /, 也 就 是 说 , 7 * 8! 表示 7* (81) 而 不 是 (7 * 8)1。 通 过 修改 文法 来 描述 优先 级 更 高 的 运 
算 符 , 为 了 与 数学 中 阶乘 的 定义 统一 , 我 们 规定 0! 等 于 1。 

4. 定义 包含 一 个 字符 串 和 一 个 值 两 个 成 员 的 类 Name_value, 给 出 其 构造 也 数 (与 Token 的 构造 函数 有 些 类 
似 ) ,然后 使 用 vector < Name_value > 而 不 是 两 个 vector 重 做 第 4 章 的 习题 19 。 

5. 将 the 加 到 6. 4. 1 节 中 的 “英语 ”文法 中 ,以 便 能 描述 “The birds fly but the fish swim” 这 样 的 语句 。 

6. 根据 6. 4. 1 节 中 给 出 的 “英语 "文法 , 编写 程序 判断 一 个 句子 是 否 符 合 英 语 语法 。 假 设 每 个 句子 都 以 句号 
(. ) 结 束 , 句号 的 两 边 有 空格 。 例 如 ,“birqs fy but the fish swim . ”是 一 个 合法 的 句子 , 但 “birds fly but 
the fish swim (缺少 句号 ) 和 “birds fly but the fish swim. "(句号 之 前 没有 空格 ) 都 不 是 正确 的 句子 。 对 输 
人 的 每 个 句子 , 程序 能 够 输出 “OK "或 者 “not OK. ”。 提 示 : 不 要 为 单词 的 处 理 而 困扰 , 直接 使 用 >> 来 读 
人 字符 串 即 可 。 

7. 为 逻辑 表达 式 编 写 一 个 文法 。 逻 辑 表达 式 与 算术 表达 式 是 非常 相似 的 , 除了 前 者 使 用 逻辑 运算 符 ! 
( 非 )、~ ( 补 )、 &( 与 )、1( 或 ) 和 “( 蜡 或 ) ,而 后 者 使 用 算术 运算 符 。 其 中 ,，! 与 ~ 是 前 弘一 元 运算 符 ， 
异 或 运算 的 优先 级 高 于 或 运算 , 因此 xly”z 表示 xl(y“z) 而 不 是 (xly)^zi; 与 运算 的 优先 级 高 于 异 或 运 
算 , 因此 x^y&zz 表示 x^ (y&z) 。 

8. 使 用 四 个 字母 而 不 是 四 个 数字 重 做 第 5 章 的 习题 12 中 的 “Bulls and Cows” 游戏 。 

9. 编写 一 个 程序 , 读 人 数字 并 将 其 组 合 为 整数 。 例 如 , 读 人 字符 1、2、3 时 得 到 整数 123, 程序 应 输出 “123 
is 1 hundred and 2 tens and 3 ones”。 数 值 由 一 至 四 个 数字 构成 , 以 int 类 型 输出 。 提 示 : 如 何 从 字符 '5' 得 
到 数值 5 呢 ? 可 通过 字符 '5 ' 减 字符 '0' 得 到 , 也 就 是 '5' -'0' ==5。 

10. 排列 是 一 个 集合 的 有 序 子 集 。 例 如 , 你 要 从 60 个 数 中 选取 3 个 数 排 成 金库 密码 , 则 共有 P(60 ,3 ) 种 排 
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列 。 其 中 消 数 PP 由 如 下 公式 定义 
al 
Pl(a,b)= ap) 
其 中 ! 是 前 组 阶乘 运算 符 , 例如 , 4!1 表示 4*3 *2*1。 组 合 与 排列 相似 , 差别 在 于 不 关心 对 象 的 顺序 。 
例如 ,如 果 你 想 从 5 种 不 同 口味 的 冰淇淋 中 选 出 3 种 制作 香蕉 圣 代 , 那么 你 不 必 关 心 香草 冰淇淋 是 先 加 


入 的 还 是 后 加 入 的 ， 因 为 无 论 如 何 香草 冰淇淋 都 得 加 进去 。 组 合 的 计算 方式 如 下 : 

C(a,b) = 

设计 一 个 程序 , 让 用 户 输入 两 个 数字 , 询问 用 户 是 计算 排列 还 是 组 合 , 然后 输出 计算 结果 。 这 项 工作 包 
含 以 下 几 个 步 又: 首先 分 析 上 面 给 出 的 需求 , 确定 程序 需要 完成 的 功能 ; 然后 进入 设计 阶段 ,编写 伪 代 
码 , 并 将 其 分 解 为 多 个 子 模块 。 程 序 应 该 具有 错误 检查 机 制 ,保证 程序 对 错误 的 输入 产生 恰当 的 错误 提 
示 信息 。 
》 附 言 

了 解 输入 的 含义 是 程序 设计 的 重要 组 成 部 分 ,每 个 程序 都 会 以 某 种 形式 面 对 这 个 问题 。 其 中 , 又 以 了 
解 那些 由 人 类 直接 生成 的 信息 的 含义 最 为 困难 。 例 如 , 语音 识别 仍然 是 一 个 非常 困难 的 研究 课题 。 当 然 ， 
这 类 问题 中 也 有 一 些 较为 简单 ,例如 本 章 所 研究 的 计算 器 , 可 以 通过 用 文法 描述 输入 的 方式 来 处 理 。 
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不 到 好 后 9 不 见 分 本 
一 歌剧 谤 语 


编写 程序 需要 不 断 地 改进 你 要 实现 的 功能 及 其 表达 方式 。 第 6 章 中 我 们 给 出 了 一 个 能 够 正确 
运行 的 计算 器 程序 的 初步 版 本 , 本 章 将 对 其 进行 进一步 的 完善 和 优化 。“ 完成 程序 ”意味 着 使 程序 
更 易于 用 户 使 用 , 更 方便 开发 者 维护 一 一 包括 改进 用 户 接 口 、 添 加 一 些 重要 的 错误 处 理 机 制 、 境 
加 一 些 有 用 的 功能 、 重 构 代 码 使 之 易于 理解 和 修改 。 


7.1 介绍 


当 你 的 程序 第 一 次 正常 运行 时 , 你 大 约 只 完成 了 一 半 工 作 。 如 果 是 一 个 大 程序 或 者 一 个 
由 于 不 能 正常 运行 而 造成 不 良 后 果 的 程序 , 那 连 一 半 工 作 也 没完 成 。 一 旦 程序 能 初步 正常 
运行 , 编程 的 真正 乐趣 就 开始 了 ! 从 这 里 开始 , 我 们 可 以 在 初步 版 本 上 试验 各 种 不 同 的 

本 章 将 引导 你 如 何以 一 名 专业 程序 员 的 眼光 来 优化 第 6 章 给 出 的 计算 融 程 序 。 值 得 注 
意 的 是 ,本章 提出 的 程序 相关 的 问题 以 及 一 些 思考 , 远 比 计算 器 程序 本 身 有 趣 得 多 。 本 章 将 
通过 一 个 实例 讲述 如 何在 实际 需求 和 约束 条 件 的 压力 下 逐步 优化 程序 。 


7.2 输入 和 输出 


让 我 们 回 到 第 6 章 开 始 , 你 会 发 现 我 们 当初 决定 采用 提示 信息 ”Expression:” 提 示 用 户 输入 表 
达 式 , 用 提示 信息 “Result : ”提示 输出 计算 结果 。 人 迫 于 使 程序 尽快 运行 起 来 的 压力 ,我们 忽略 了 这 
些 看 似 不 重要 的 细节 。 这 是 很 常见 的 ,我 们 不 可 能 一 开始 就 考虑 所 有 人 情况。 因此， 当 我 们 停 下 来 
反思 的 时 候 , 发 现 忘 记 了 最 初 想 要 实现 的 一 些 功 能 。 

对 于 某 些 程 序 设 计 任务 , 原始 需求 是 不 能 改变 的 。 这 一 原则 过 于 死板 , 会 给 问题 求解 方案 的 
设计 带 来 很 多 困难 。 假 定 我 们 可 以 修改 需求 , 我 们 又 该 如 何 做 呢 , 应 该 修改 哪些 需求 ,哪些 又 应 
该 保持 不 变 ? 我 们 真 的 让 程序 输出 提示 信息 ”Expression:” 和 “Result:" 吗 ? 仅仅 靠 “ 想 "是 不 行 的 ， 
最 好 是 实际 试验 一 下 , 看 看 哪 种 方式 效果 更 好 。 现 在 我 们 输入 

2+3; 5*7; 2+9; 


输出 结果 为 : 
=5 
= 35 
=11 
如 果 在 程序 中 添加 “Expression:” 与 “Result:”, 将 得 到 如 下 结果 : 
Expression: 2+3; 5*7; 2+9; 
Result :5 
Expression: Result: 35 
Expression: Result: 11 
Expression: 


我 们 相信 ,一些 人 会 喜欢 前 一 种 风格 ,而 其 他 人 会 喜欢 后 一 种 。 因 此 可 以 考虑 给 予 用 户 选 择 
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.自己 喜欢 的 风格 的 权力 。 但 对 于 这 个 简单 的 计算 器 程序 来 说 , 提供 两 种 输入 /输出 风格 供用 
户 选 择 显得 过 于 繁琐 。 因 此 , 我们 必须 确定 使 用 哪 种 风格 。 我 们 认为 输出 “Expression:” 与 
“Result:“” 令 程序 有 点 复杂 , 而 且 会 分 散 注意 力 。 如 果 使 用 这 些 提示 信息 的 话 , 真正 有 用 的 
表达 式 输 入 与 结果 输出 在 屏幕 显示 窗口 中 只 占据 很 少 一 部 分 , 而 表达 式 和 结果 才 是 我 们 真 
正 关 心 的 内 容 , 其 他 内 容 不 应 分 散 注 意 力 。 田 一 方面 , 应 该 把 用 户 输入 的 表达 式 和 计算 机 输 
出 的 结果 区 分 开 , 否则 用 户 可 能 会 无 法 分 辨 出 结果 。 在 最 初 调试 程序 时 , 我 们 用 = 表示 计算 
结果 的 输出 。 类 似 地 , 我 们 也 可 以 使 用 一 个 简短 的 “提示 符 ” 来 提示 用 户 输入 一 一 字符 > 经 
常用 作用 户 输入 提示 符 : 


这 种 方式 看 起 来 好 多 了 , 我 们 只 需 对 main( ) 函数 中 的 主 循 环 做 一 点 改动 即 可 实现 这 种 方式 : 
double val = 0; 
while (cin) { 
cout<<">"; /printprompt 


Token t= ts.get(); 
if (t.kind == 'q') break; 
if (tkind == ';') 
cout << "= "<<val << \n' /printresult 
else 
ts.putback(t); 
val = expression(); 


} 
不 洽 的 是 , 如 果 在 一 行 上 输入 多 个 表达 式 , 其 输出 仍然 比较 混乱 : 


>2+3; 5*7; 2+9; 
三 了 


根本 原因 是 我 们 在 开始 开发 程序 时 就 认为 用 户 不 会 在 一 行 中 输入 多 个 表达 式 ( 至 少 我 们 假设 用 户 
不 会 这 样 ) 。 对 于 这 种 情况 , 我 们 期 望 的 输出 方式 如 下 : 


> 2+3; 5*7; 2+9; 


这 种 显示 方式 看 起 来 很 合理 , 但 不 幸 的 是 , 实现 它 却 很 麻烦 。 首 先 看 一 下 main( ) 函数 , 我 们 希望 
只 有 在 后 面 不 跟着 符号 = 的 情况 下 , 才 输 出 提示 符 > ,这 能 够 实现 吗 ? 答案 是 否定 的 , 因为 我 们 
根本 没有 办 法 判定 这 种 情况 ! 因为 程序 是 在 get( ) 函数 调用 之 前 输出 提示 符 > 的 , 而 此 时 无 法 知 
道 get( ) 函数 是 真正 读 取 了 新 字符 , 还 是 简单 地 将 已 经 从 键盘 读 人 的 字符 组 成 单词 返回 给 我 们 。 
换 句 话说 , 我 们 可 能 不 得 不 弄 乱 Token_stream 才能 实现 上 述 输出 形式 。 

我 们 认为 现在 的 输出 形式 已 经 基本 满足 要 求 了 ,因此 不 再 进行 改进 。 如 果 将 来 我 们 发 现 必 须 
修改 Token_stream 类 , 那 时 再 来 重新 考虑 这 个 决定 。 不 过 , 修改 程序 的 主要 数据 结构 ,只 是 为 了 
获得 一 点 小 小 的 改进 , 这 是 不 明智 的 。 而 且 , 我 们 还 未 对 计算 器 程序 进行 过 全 面 的 测试 ,因此 目 
前 我 们 决定 不 做 输出 形式 上 的 改进 。 
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7.3 错误 处 理 


当 你 的 程序 能 够 初步 运行 时 , 你 应 该 做 的 第 一 件 事 就 是 打破 它 一 一 也 就 是 给 它 各 种 输入 ,期 
望 它 表现 出 错误 的 行为 。“ 期 望 " 的 意思 是 , 在 这 个 阶段 , 我 们 所 面临 的 挑战 是 要 发 现 尽 可 能 多 的 
程序 错误 , 以便 在 最 终 交 付 用 户 之 前 将 其 修正 。 如 果 你 做 这 项 工作 时 的 态度 是 “我 的 程序 已 经 正 
常 运行 了 , 我 是 不 会 犯错 误 的 1" 那 么 你 将 不 会 发 现 很 多 错误 , 而 一 旦 真 的 发 现 错误 时 , 你 又 会 非 
常 泪 丧 。 你 应 该 调适 自己 的 心理 , 进行 程序 测试 时 的 正确 态度 应 该 是 “我 能 打败 它 ! 我 比 任何 程 
序 都 聪明 ,即使 是 我 自己 编写 的 程序 1" 我 们 可 以 使 用 一 些 正确 的 和 不 正确 的 表达 式 混合 在 一 起 的 
输入 来 测试 计算 器 程序 , 例如 : 


1+24+34+44+5+64+71+8 
1—2-3-4 

1+2 

站 

(1+3; 

(1+); 
1*2/3%04+5-—6; 

0; 


1+; 


斌 一 试 尝试 用 一 些 不 同 的 “问题 表达 式 " 来 测试 计算 器 程序 , 看 看 你 能 使 它 表现 出 

多 少 种 不 同 的 错误 行为 。 你 能 使 程序 崩溃 吗 一 一 使 程序 跑 过 错误 处 理 机 制 而 直接 输出 平 

台 级 的 出 错 信 息 ? 我 们 认为 你 做 不 到 。 你 能 让 程序 异常 退出 而 不 输出 任何 错误 信息 吗 ? 

载 想 你 是 可 以 做 到 的 。 

这 种 技术 称 为 测试 (test) 。 有 些 人 专门 从 事 这 项 工作 , 负责 找 出 程序 中 的 错误 。 测 试 是 软件 
开发 中 很 重要 的 一 个 环节 , 而 且 并 非 像 想象 的 那样 枯燥 , 实际 上 是 可 以 很 有 趣 的 , 我 们 将 在 第 26 
章 中 详细 讨论 程序 测试 的 一 些 细节 问题 。 关 于 程序 测试 的 一 个 重要 问题 是 “能 否 对 程序 进行 系统 
测试 从 而 发 现 所 有 的 错误 ?” 这 个 问题 没有 一 个 普 适 的 管 案 , 也 就 是 说 , 没有 任何 一 个 答案 对 所 有 
程序 都 成 立 。 不 过 , 对 于 大 多 数 程序 而 言 ,严格 的 测试 通常 都 会 获得 很 好 的 效果 。 程 序 测试 最 重 
要 的 环节 之 一 是 系统 性 地 设计 测试 用 例 , 为 了 防止 测试 设计 不 全 面 的 情况 ， 你 可 以 用 一 些 “不 合 


理 的 "输入 来 测试 程序 。 例 如 , 对 计算 器 程序 输入 : 


Mary had a little lamb 
srivrqtiewcbet7rewaewre-—wqcntrretewru754389652743nvcqnwq; 
1@#$%A (~:; 


在 此 , 我 再 一 次 使 用 了 我 习惯 性 的 做 法 : 将 电子 邮件 的 内 容 ( 包 括 邮 件 头 、 邮 件 正 文 等 所 有 内 容 ) 
输入 给 编译 器 , 来 测试 编译 器 的 反应 。 这 看 起 来 不 合 情 理 , 因为 “没有 人 会 这 样 做 "。 但 在 实际 应 
用 中 , 完美 的 程序 应 该 能 捕获 所 有 错误 , 并 且 能 够 从 “奇怪 的 输入 "中 快速 恢复 正常 运行 , 而 不 是 





134 ” 锡 一 部 分 态 衣 知 厌 


只 能 处 理 那 些 “ 合 乎 情理 ”的 输入 。 
在 测试 计算 器 程序 时 , 第 一 个 棘手 的 问题 是 当 输 入 下 列 非法 表达 式 时 , 程序 窗口 会 立刻 关闭 : 


1+2 
稍 加 思考 或 者 跟踪 一 下 程序 的 执行 过 程 就 会 发 现 , 问题 在 于 , 在 输出 错误 信息 后 , 程序 窗口 就 立 
刻 关 闭 了 。 这 是 因为 我 们 保持 窗 活 牙 是 为 了 等 竺 用户 输入 字符 。 然 而 ,对 于 上 述 三 种 输入 而 言 ， 
程序 在 读 人 所 有 字符 之 前 就 检测 到 了 一 个 错误 , 因此 输入 行 中 还 剩 下 未 被 读 人 的 字符 。 但 是 ,， 程 
序 不 能 区 分 它 是 “剩余 字符 "还 是 用 户 在 看 到 提示 信息 “Enter a character to close window ”后 输入 的 
字符 。 于 是 , 这 个 “剩余 字符 ”就 被 程序 认为 是 关闭 窗口 的 命令 ， 导 致 程序 窗口 被 关闭 。 

我 们 可 以 对 main( ) 范 数 稍 做 修改 来 处 理 这 个 问题 (参见 5. 6.3 节 ) : 


catch (runtime_error& e) { 
cerr << e.what() << endl; 
// keep_window_open(): 
cout << "Please enter the character ~ to close the window\n'; 
char ch; 
while(cin >> ch) //keep reading until we find a ~ 
if (ch=='~") return 1; 
return 1; 


} 
基本 上 , 我 们 将 keep_window_open( ) 函数 完全 蔡 换 为 新 的 代码 , 来 处 理 上 述 问题 。 但 需要 注意 , 如 果 ~ 
恰好 是 发 生 错误 之 后 的 下 一 个 输入 字符 , 上 述 问题 仍然 存在 , 不 过 这 种 情况 出 现 的 可 能 性 就 小 得 多 了 。 
我 们 可 以 编写 一 个 新 版 本 的 keep_window_open( ) 果 数 处 理 这 个 问题 ， 它 接受 一 个 字符 串 参 
数 ， 只 有 用 户 在 看 到 提示 信息 后 输入 这 个 字符 串 , 程序 才 会 关闭 窗口 ,其 简单 实现 如 下 : 


catch (runtime_error& e) { 
cerr << e.what() << endi' 
keep_window_open("~~"); 
return 1; 


} 
此 时 输入 如 下 内 容 : 


+]1 
11~~ 


0 
计算 器 程序 会 在 输出 错误 信息 后 给 出 如 下 提示 信息 ， 


Please enter ~~ to exit 
直到 用 户 输入 ~~ 后 才 退 出 。 

计算 器 程序 从 键盘 获取 输入 , 这 使 得 程序 测试 过 程 非常 乏味 : 每 当 对 程序 做 出 改动 , 我 们 都 
要 (再 一 次 ) 从 键盘 手工 输入 许多 测试 用 例 , 以 测试 程序 修改 是 否 正确 。 因 此 , 最 好 能 将 测试 用 例 
保存 起 来 ， 人 对 于 以 UNIX 为 代表 的 操作 系统 来 说 ， 
在 不 改变 程序 的 情况 下 , 令 cin 从 文件 而 不 是 键盘 输入 数据 , 令 输出 到 cout 的 内 容 转向 到 文件 ， 
是 非常 容易 的 。 但 如 果 在 你 所 使 用 的 操作 系统 中 ， 这 种 输入 /输出 重 定向 很 难 实现 , 则 必须 对 程 
序 代码 进行 修改 (参见 第 10 章 )。 


现在 考虑 下 面 两 个 输入， 
1+2; q 


和 
1+2 9 
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我 们 希望 程序 对 于 这 两 个 输入 都 能 够 在 输出 结果 (3) 之 后 退出 。 但 奇怪 的 是 , 1 +2 q 确实 是 这 样 
的 , 而 看 起 来 显然 更 正确 的 1+2;q 却 引 发 了 一 个 “Primary expected” 错误 。 我 们 应 该 如 何 来 查找 
这 个 错误 呢 ? 在 6.6 节 中 , 我 们 匆忙 地 在 main( ) 函数 中 加 入 了 对 ;与 q 的 处 理 , 分 别 表示 “打印 ” 
和 “退出 ”。 现 在 , 我 们 要 为 这 种 匆忙 付出 代价 了 。 重 新 审视 这 部 分 代码 : 


double val = 0; 
while (cin) { 
cout << "> ; 
Token t= ts.get(); 
if (t.kind == 'q') break; 
if (t.kind == ';") 
cout << "=" <<val<< \n'; 
else 
ts.putback(t); 
val = expression(); 


} 
在 上 面 的 代码 中 , 判断 输入 是 分 号 后 就 不 再 检测 q, 而 是 直接 继续 调用 expression( ) 陋 数 。expres- 
sion( ) 晒 数 首先 调用 term( ) , term( ) 首 先 调用 primary( ) , primary( ) 首先 检测 9g。 由 于 字符 q 不 是 
primary ， 从 而 输出 错误 信息 。 因 此 , 我 们 应 该 在 检测 完 分 号 以 后 再 对 字符 q 进行 检测 。 对 当前 的 
程序 , 我 们 觉得 有 必要 适当 简化 程序 逻辑 , 完整 的 main( ) 函数 如 下 : 


int main() 
fry 
{ 
while (cin) { 
cout << "> "; 
Token t= ts.get(); 
while (t.kind == ' 7) ft=ts.get0; /eat';’ 
if (t.kind == 'q') { 
keep_window_open(); 
return 0; 


} 
ts.putback(t); 
cout << "= " << expression() << endl; 
} 
keep_window_open(); 
return 0; 
} 
catch (exception& e) { 
cerr << e.what() << endl; 
keep_window_open("~~"); 
return 1; 


} 

catch (...) { 
Cerr << "exception \n"; 
keep_window_open("~~"); 
return 2; 


改动 之 后 的 代码 实现 了 强 有 力 的 错误 处 理 机 制 , 接 下 来 我 们 就 可 以 开始 考虑 从 其 他 方面 改进 计算 
器 程序 了 。 


7.4 处理 负数 


当 你 测试 完 计 算 顺 程序 后 ,你 会 发 现 它 不 能 很 好 地 处 理 负 数 。 例 如 , 输入 -17/2 将 返回 一 个 
错误 信息 ,必须 将 其 写 为 (0 -1)/2, 但 这 并 不 符合 人 们 的 使 用 习惯 。 
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在 程序 调试 和 测试 后 期 发 现 这 样 的 问题 是 很 平常 的 事 ， 只 有 这 时 我 们 才能 有 机 会 弄 清楚 程序 到 后 
实现 了 什么 功能 , 并 根据 程序 给 出 的 反馈 不 断 改 进 我 们 的 设计 。 在 程序 的 设计 过 程 中 , 一 种 明智 的 做 法 
是 : 在 安排 工作 日 程 时 就 预 留 出 时 间 , 使 我 们 能 有 机 会 体会 开发 过 程 中 获得 的 经 验 教训 ,从 中 受益 并 回 
过 头 来 改进 程序 。“1.0 版 ”往往 未 经 必要 的 精 化 就 发 布 了 , 这 通常 是 由 于 开发 日 程 过 紧 , 或 者 是 为 了 防 
止 在 项 目 “ 后 期 ”对 详细 设计 进行 修改 而 采取 的 呆板 的 项 目 管理 策略 一 一 “后 期 "添加 “特性 ”的 做 法 将 是 
灾难 性 的 。 但 实际 上 ， 当 一 个 程序 对 于 简单 使 用 来 说 已 经 足够 好 , 但 还 未 到 可 以 发 布 的 程度 时 , 开发 进 
程 还 远 未 到 “后 期 " 。 此 时 还 是 开发 进程 的 “早期 ， 正 是 我 们 从 程序 中 获取 实 实在 在 的 经 验 教训 , 进行 
改进 的 好 时 机 。 在 实际 安排 工作 日 程 时 , 应 该 将 这 样 的 过 程 考虑 其 中 。 


对 于 本 例 , 我 们 只 需 通过 修改 文法 来 处 理 一 元 减 。 最 简单 的 方式 是 修改 primary 的 定义 , 将 
Primary: 
Rb 
"(" Expression ")" 
改 为 : 
Primary: 
Number 
"(" Expression ")" 
"一 ”Primary 
"r+" Primary 


我 们 还 增加 了 一 元 加 ,C++ 语言 也 支持 这 个 运算 符 。 当 有 了 一 元 减 后 ， 人们 通常 也 会 尝试 一 元 
加 , 因此 实现 它 是 有 意义 的 。 而 且 既 然 实 现 了 一 元 减 , 实现 一 元 加 也 很 容易 , 没有 必要 纠缠 于 它 
到 底 有 没有 用 。 于 是 , 实现 Primary 的 也 数 变 为 


double primary() 
{ 
Token t= ts.get(); 
switch (t.kind) { 
case'(’: /handle '(' expression 小 
{ 
double d = expression(); 
t= ts.get(); 
if (tkind ! = )) error("')’ expected"); 
return d; 
} 
case '8': // we use '8' to represent a number 
return t.value; // return the numbers value 
Case 一 : 
return ~ primary(); 
Case '+': 
return primary(); 
default: 


error("primary expected"); 
} 
} 


修改 后 的 Primary 看 起 来 非常 简洁 , 它 第 一 次 可 以 真正 地 正常 运行 了 。 
7.5 模 运算 : % 


当 我 们 最 初 分 析 理 想 中 的 计算 器 程序 应 该 具有 什么 功能 时 , 我 们 希望 它 能 够 处 理 模 运算 (也 
称 为 取 余 运算 ) : % 。 但 C++ 语言 中 的 模 运 算 符 不 支持 浮上 点数, 因而 未 加 以 实现 。 现 在 我 们 可 以 
重新 考虑 模 运算 了 , 可 按 如 下 方式 简单 实现 : 

1) 添加 单词 % 。 
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2) 将 double 型 数 转换 为 int 型 , 并 使 用 % 处 理 转换 后 的 int 型 数 。 
为 此 , 在 term( ) 函数 中 增加 以 下 代码 : 


Case '%': 

{ double d = term()， 
int 11 = int(left); 
int i2 = int(d); 
return i1%i2; 


} 
其 中 , int(d) 表 示 将 double 型 数据 通过 截 尾 方式 显 式 强制 转换 为 int 型 数据 , 即 简单 地 将 小 数 点 后 
面 的 尾数 丢弃 。 不 幸 的 是 , 这 种 转换 是 多 余 的 (参见 3.9.2 节 ), 但 我 们 仍然 倾 癌 于 进行 显 式 数据 
类 型 的 转换 , 而 不 是 “无 意 中 ” 将 double 隐 式 转换 为 int。 这 样 ,一切 都 明确 地 在 我 们 掌握 之 中 。 
现在 ,计算 器 程序 能 正确 处 理 整 型 数 的 模 运 算 了 。 例 如 : 
> 2%3; 


=2 
> 3%2; 


如 何 处 理 非 整 型 数 的 模 运 算 ? 下面 表 达 式 的 结果 是 多 少 ? 


> 6.7%63.3; 
目前 还 没有 很 好 的 答案 , 因此 应 禁止 对 浮 点 数 进行 模 运 算 。 当 检测 到 参与 模 运 算 的 浮 点 数 有 小 数 
部 分 时 ,就 给 出 错误 提示 信息 。 修 改 后 的 term( ) 函数 如 下 : 


double term() 


double left = primary(); 
Token t= ts.get(); // get the next token from Token_stream 


while(true) { 
switch (t.kind) { 


Case '*': 
left *= primary(); 
t= ts.get(); 
break; 
case /': 
{ double d = primary(); 
if (d == 0) error("divide by zero"); 


left /= d; 
t={s.get(); 
break; 

} 

Case '%!'!: 


{ doubie d = primary(); 
int i1 = int(left); 
if (i1 1= left) error ("left-hand operand of % not int"); 
int 12 = int(d); 
if (i2 1= d) error ("right-hand operand of % not int"); 
if (i2 == 0) error("%: divide by zero"); 
left = i1%i2; 
t=ts.get(); 
break; 
} 
default: 
ts.putbackt(t); // put t back into the Joken_stream 
return left; 


138 “” 田 一 部 分 才 太 知人 大 


将 浮 扣 型 数 转换 为 整 型 数 后 ,可 以 使 用 ! = 来 检测 数值 是 否 发 生变 化 。 如 果 没 有 , 则 表明 浮 点 数 
没有 小 数 部 分 , 可 使 用 % 进行 模 运 算 。 

我 们 这 里 将 模 运 算 的 操作 数 限定 为 整数 ,是 缩小 转换 (参见 3.9.2 节 和 5.6.4 节 ) 的 变形 之 
一 ， 因 此 可 以 使 用 narrow_cast( ) 函数 解决 : 


Case '%': 

{ intil = narrow_cast<int>(left); 
int i2 = narrow_cast<int>(term()); 
if (i2 == 0) error("%: divide by zero"); 
left = i1%i2; 
t=ts.get(); 
break; . 

} | 

这 个 版 本 非常 简短 ,而且 可 以 说 很 清晰 , 但 它 没有 给 出 恰当 的 错误 提示 信息 。 


7.6 清理 代码 


我 们 已 经 对 程序 做 过 几 次 修改 ,虽然 性 能 每 次 都 有 所 提高 , 但 代码 却 变 得 有 点 乱 。 现 在 是 一 
个 很 好 的 时 机 来 重新 检查 代码 , 做 适当 的 清理 和 简化 , 并 增加 一 些 注释 以 提高 系统 的 可 读 性 。 换 
名 话说 , 只 有 当代 码 达 到 易于 他 人 接管 和 维护 的 状态 , 程序 才 算 是 编写 完成 。 到 目前 为 止 , 除了 
缺少 注释 外 , 计算 器 程序 总 体 来 说 还 是 不 错 的 , 接 下 来 我 们 进行 一 点 清理 工作 。 
7.6.1 符号 常量 

回忆 一 人 下, 我们 使 用 '8' 表 示 单 词 中 包含 一 个 数值 。 实 际 上 , 采用 什么 值 表示 数值 类 型 的 单 
词 并 不 重要 ,只 要 该 值 能 够 与 标识 其 他 单词 类 型 的 数值 区 分 开 即 可 。 不 过 , 这 种 处 理 方式 使 得 代 
码 看 起 来 有 点 古怪, 我 们 应 该 使 用 注释 语句 进行 相应 的 说 明 。 


case 'B': / we use '8' to represent a number 
return t.value; / return the numbers value 

Case 一: 
return ~ primary(); 


老实 说 , 我 们 也 犯 过 一 些 错误 ， 比 如 错 敲 了 '0' 而 不 是 '8' ,因为 我 们 忘记 了 我 们 到 底 选 的 是 哪个 
值 来 标识 数值 型 单词 。 换 句 话 说, 直接 在 代码 中 用 '8' 来 标识 数值 型 单词 是 很 草率 的 , 而 且 不 容 
锡 记 住 , 很 容易 造成 人 为 错误 一 一 实际 上 '8' 就 是 我 们 在 4.3. 1 节 中 曾经 提 到 的 应 该 避免 的 “ 魔 
数 ”。 我 们 应 该 引入 一 个 符号 常量 , 来 代表 这 个 数 : 

const char number='8'; //t.kind==number means thatt is a number Token 
const 修饰 符 告诉 编译 器 我 们 定义 了 一 个 值 为 '8' 的 字符 常量 : 对 number ='0', 编译 器 将 会 给 出 错 
误 信 息 。 定 义 了 字符 常量 number 以 后 , 我 们 就 不 必 显 式 地 用 '8' 来 表示 数值 型 单词 了 。primary 也 





数 中 的 相应 代码 片段 修改 如 下 : 
case number: 
return t.value; AH return the numbers value 
Case —': 


return — primary(); 
这 段 代 码 不 再 需要 任何 注释 了 。 实 际 上 , 代码 本 身 直接 而 又 清晰 地 表达 出 的 内 容 , 是 任何 注释 都 
无 法 表达 清楚 的 。 如 果 频 繁 地 用 注释 来 解释 程序 的 含义 , 通常 表明 你 的 代码 应 该 改进 了 。 
类 似 地 ，Token_stream: get( ) 函数 中 识别 数值 的 代码 修改 为 : 


英 7 但 完成 一 个 程 订 139 


CASE 。: 
case ‘0': case "1': Case '2': case '3': case '4'; 
Case '5':; case '6': case 7': Case '8': Case '9': 
{ cin.putback(ch); I put digit back into the input stream 
double val; 
cin >> val; 1/ read a floating-point number 
return Token(number,val); 


} 
理论 上 可 以 为 所 有 的 单词 设置 符号 名 称 , 但 是 太 过 于 繁琐 。 毕竟, 用 '(' 和 ' +' 表 示 左 括号 和 加 
号 这 两 个 单词 , 是 任何 人 痢 能 够 理解 的 很 显然 的 表示 方法 。 检 查 计算 器 程序 涉及 的 单词 只 有 
用 '; ' 表 示 “ 打 印 ”( 或 “表达 式 结束 " ) 以 及 用 'q' 表 示 “ 退 出 ”有些 不 妥 。 为 什么 不 用 'p' 和 'e' 呢 ? 
在 一 个 大 程序 中 , 这 种 模糊 而 随意 的 表示 方式 迟早 会 引起 问题 , 所 以 我 们 引入 如 下 声明 ; 


const char quit='q'’; /Nt.kind==quit means thatt is a quit Token 
const char print ="';'; tkind==print means thatt is a print Token 


下 面 修改 main( ) 函数 中 的 循环 代码 ， 
while (cin) { 

cout << "> "; 

Tokent = ts.get(); 

while (t.kind == print) t=ts.get(); 

if (t.kind == quit) { 
keep_window_open(); 
return 0; 


} 
ts.putback(t); 
cout << "=" << expression() << endl; 


} 
引信 符号 名 称 “print” 和 “quit” 后 , 提高 了 代码 的 可 读 性 。 男 外 , 我 们 并 不 辟 励 人 们 通过 阅读 
main( ) 函数 来 推测 输入 什么 内 容 表 示 " print” 和 “quit”。 例 如 ,如 果 我 们 决定 用 "e”( 代表“ exit”) 
表示 “ quit”, 应 该 是 很 正常 的 , 而且 这 一 改动 应 该 不 用 改变 main( ) 函数 中 的 任何 代码 。 

输入 /输出 提示 符 " >" 和 " =" 也 同样 存在 问题 , 代码 中 存在 这 么 多 概念 模糊 的 符号 ， 如 何 让 
初级 程序 员 在 阅读 main( ) 函数 时 猜测 其 正确 含义 ? 为 代码 添加 注释 是 一 个 好 主意 , 但 如 前 所 述 ， 
引入 符号 常量 更 加 有 效 : 


const string prompt = "> "; 
const string result = "= "; I/ used to indicate that what follows is a result 


我 们 想 改变 输入 /输出 提示 符 时 该 怎么 办 呢 ? 只 需 修改 这 些 稍 量 即 可 , 主 函 数 中 的 循环 修改 如 下 : 
while (cin) { 
cout << prompt; 
Token t= ts.get(); 
while (t.kind ==print) t=ts.get(); 
if (t.kind == quit) { 
keep_window_open/(); 
return 0; 


} 
ts.putback(t); 
cout << result << expression() << endl; 


} 
7.6.2 使 用 函数 

程序 中 所 使 用 的 函数 应 该 反映 出 该 程序 的 基本 结构 ,而 函数 名 则 应 有 效 地 标识 代码 的 逻辑 功 
能 模块 。 到 目前 为 止 , 计算 器 程序 在 这 些 方面 做 得 还 是 比较 好 的 : expression ( ) 、term ( ) 和 
primary( ) 直接 反映 出 我 们 对 表达 式 文法 的 理解 ,而 函数 get( ) 则 用 来 处 理 表达 式 输 入 和 单词 识 


140 ”名 一 部 分 大 杰 知 大 


别 。 分 析 一 下 主 函 数 main( ) , 我 们 注意 到 它 主要 做 了 两 项 逻辑 上 相互 独立 的 任务 : 

1) main( ) 函数 搭 起 了 程序 的 整体 框架 : 启动 程序 、 结 束 程序 、 处 理 致命 错误 。 

2) main( ) 函数 用 一 个 循环 来 计算 表达 式 。 
理想 情况 下 , 一 个 函数 只 实现 一 个 独立 的 逻辑 功能 (参见 4.5. 1 节 )。 而 main( ) 实 现 了 两 个 功能 ， 
这 使 得 程序 结构 变 得 有 些 模 糊 。 一 种 显然 的 改进 方法 是 将 表达 式 计 算 循环 从 主 函 数 中 分 离 出 来 ， 


实现 为 calculate( ) 枯 数 
void caiculate() / expression evaluation loop 
{ 
while (cin) { 


cout << prompt; 
Token t = ts.get(); 
while (t.kind == print) t=ts.get();  / first discard all “prints” 


if (t.kind == quit) return; / quit 
ts.putback(t); 
cout << result << expression() << endl; 
} 
} 
int main() 
try { 
calculate(); 
keep_window_open(); // cope with Windows console mode 
return 0; 
} 


catch (runtime_error& e) { 
cerr << e.what() << endl; 
keep_window_open("~~"); 
return 1; 

} 

catch (. . .){ 
cerr << "exception \n"; 
keep_window_open("~~"); 


return 2; 
} 
修改 后 的 代码 更 直接 地 反映 了 程序 的 结构 , 更 易于 理解 。 
7. 6.3 代码 格式 z 
重新 检查 一 下 计算 器 程序 , 看 看 其 中 是 否 有 “丑陋 ”的 代码 , 我 们 发 现 : 
switch (ch) { 
Case 'q': Case ';': Case '%': case '(': case ')': Case '+': Case ~': Case '*': case /': 
return Token(ch); / jet each character represent itself 


在 加 入 对 'q'、';' 和 '%' 的 处 理 之 前 , 这 段 代码 还 不 算 太 坏 , 但 现在 变 得 有 些 混乱 。 代 码 的 可 读 
性 越 差 , 其 中 的 错误 就 越 难以 发 现 。 而 这 段 代码 中 确实 隐藏 着 一 个 潜在 的 bug! 我 们 修改 一 下 代 
码 , 令 每 行 代码 只 对 应 switeh 语句 的 一 种 情况 , 并 加 入 适当 的 注释 来 帮助 代码 理解 , 修改 后 的 To- 
ken_stream 的 get( ) 函数 如 下 所 示 : 


Token Token_stream: :get() 
// read characters from cin and compose a Token 
{ 
if (full) { / check if we already have a Token ready 
full=false; 
return buffer; 
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char ch; 
cin>>ch; Wnote that >> skips whitespace (space, newjine, tab, etc.) 


switch (ch) { 
case quit: 
case print: 
case '(': 
case )': 
Case '+': 
Case —': 
case T 本 ?4 
Case /': 
Case 2 : 
return Token(ch);  / let each character represent itself 
Case '.': // a floating-point-literal can start with a dot 
case '0': case '1': case '2': case '3': case '4': 
Case '5': case '6': case '7': case '8': case '9': //numeric literal 
{ cin.putback(ch); / put digit back into the input stream 


double val; 
cin >> val; // read a floating-point number 
return Token(number,val); 
} 
default: 
error("Bad token"); 
} 


} 
我 们 当然 可 以 把 对 每 个 数字 的 处 理 也 放 在 不 同 的 行 , 但 是 那样 似乎 并 不 能 使 代码 更 加 清晰 , 而 且 
导致 不 能 在 一 屏 上 显示 get( ) 函数 的 所 有 代码 。 我 们 理想 中 的 情况 是 , 每 个 函数 的 代码 都 能 全 部 
显示 在 屏幕 的 可 视 区 域 上 一 一 在 屏幕 之 外 我 们 无 法 看 到 的 代码 是 最 有 可 能 隐藏 bug 的 地 方 。 因 
此 , 代码 布局 是 非常 重要 的 。 

另外 一 个 值得 注意 的 地 方 是 , 我 们 在 程序 中 用 符号 常量 quit 替代 了 字符 'q'。 这 不 但 提高 了 
程序 的 可 读 性 , 而 且 保 证 我 们 的 编程 错误 会 被 编译 器 捕获 一 一 如 果 我 们 为 quit 操作 选择 的 字符 与 
其 他 单词 冲突 , 将 会 产生 一 个 编译 时 错误 。 

在 代码 清理 阶段 , 我 们 有 可 能 意外 地 引入 一 些 错误 。 因 此 , 在 代码 清理 之 后 一 定 要 测试 代码 
的 正确 性 。 最 好 是 每 做 一 点 改动 就 测试 一 次 ,以 便 发 现 错误 时 , 你 能 记 起 来 是 做 了 什么 样 的 改动 
导致 的 这 个 错误 。 记 住 , 及 早 测试 、 经 常 测试 。 : 
7. 6.4 注释 

我 们 在 编写 计算 器 程序 的 过 程 中 加 入 了 一 些 的 注释 。 好 的 注释 是 程序 代码 的 重要 组 成 部 分 。 
在 程序 开发 进度 很 紧 时 , 我 们 往往 会 忽略 注释 。 当 我 们 回 过 头 来 进行 代码 清理 的 时 候 , 是 一 个 很 
好 的 时 机 来 全 面 检查 程序 的 每 个 部 分 , 检查 原来 所 写 的 注释 是 否 满足 以 下 要 求 : 

1) 在 改动 了 程序 代码 以 后 , 原来 的 注释 是 否 仍 然 有 效 ? 

2) 对 读者 来 说 注释 是 否 充分 ? (通常 是 不 够 充分 的 。) 

3) 是 否 简短 清晰 , 不 至 于 分 散 读者 看 代码 的 注意 力 ? 

强调 一 下 最 后 一 条 : 最 好 的 注释 就 是 让 程序 本 身 来 表达 。 如 果 读 者 了 解 程序 设计 语言 , 对 一 
些 意义 已 经 很 明确 的 代码 ,就 应 该 避免 不 必要 的 宛 长 注释 。 例 如 ; 

X= b+c; /add b and cand assign the result to x 
你 可 能 会 在 本 书 中 发 现 一 些 类 似 的 注释 , 但 只 限于 用 来 解释 你 所 不 熟悉 的 语言 特性 的 用 法 。 

注释 一 般 用 于 代码 本 身 很 难 表达 思想 的 情况 。 换 句 话说 ,代码 说 明了 它 做 了 什么 , 但 没有 表 
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达 出 它 做 这 些 的 目的 是 什么 (参见 5.9.1 节 )。 回 顾 一 下 计算 器 程序 , 其 中 就 缺少 一 些 必要 的 注 
释 : 也 数 本 身 说 明了 我 们 是 如 何 处 理 表 达 式 和 单词 的 , 但 没有 给 出 表达 式 和 单词 的 具体 含义 。 对 
于 计算 器 程序 , 表达 式 的 文法 最 适合 放 人 代码 注释 或 者 说 明文 档 中 , 来 解释 表达 式 和 单词 的 
Ss 
/* 
Simple calculator 


Revision history: 


Revised by Bjarne Stroustrup May 2007 
Revised by Bjarne Stroustrup August 2006 
Revised by Bjarne Stroustrup August 2004 
Originally written by Bjarne Stroustrup 
(bs@cs.tamu.edu) Spring 2004. 


This program implements a basic expression calculator. 
Input from cin; output to cout. 


The grammar for input is: 


Statement: 
Expression 
Print 
Quit 


Print: 


Quit: 
q 


Expression: 

Term 

Expression + Term 

Expression — Term 
Term: 

Primary 

Term * Primary 

Term / Primary 

Term % Primary 
Primary: 

Number 

( Expression ) 

~ Primary 

+ Primary 
Number: 

floating-point-literal 


Input comes from cin through the Token_stream called ts. 
*f ， 


我 们 这 里 使 用 了 块 注释 , 它 以 /* 开头 ,一 直到 * /结束 。 在 注释 的 开始 是 程序 的 版 本 变化 历史 ， 
在 实际 程序 中 , 版 本 历史 一 般 用 于 记录 每 个 版 本 相对 于 上 一 个 版 本 做 了 哪些 修正 和 改进 。 

注意 , 注释 不 是 代码 。 实 际 上 ,上 面 注释 中 的 文法 已 经 进行 了 简化 : 对 比 注释 中 Statement 的 
规则 和 实际 的 程序 实现 可 以 看 出 来 (参见 7.7 节 中 的 代码 ) 。 注 释 中 的 规则 无 法 说 明 calculate( ) 中 
的 循环 语句 可 以 在 一 次 程序 执行 中 计算 多 个 表达 式 的 情况 。 我 们 在 7. 8. 1 节 中 将 对 这 个 问题 进行 
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进一步 探讨 。 
7.7 铺 误 恢复 


为 什么 程序 遇 到 错误 就 结束 运行 呢 ? 当初 我 们 选择 策略 时 ,这 种 方式 确实 看 起 来 简单 明了 。 
但 是 , 我 们 为 什么 不 让 程序 给 出 一 个 错误 提示 信息 , 然后 继续 运行 呢 ? 毕竟 , 我 们 常常 会 给 出 一 
些小 的 输入 错误 , 而 这 并 不 意味 着 我 们 打算 结束 程序 的 运行 。 因 此 , 我 们 下 面 尝 试 为 程序 加 入 错 
误 恢 复 能 力 。 这 意味 着 , 程序 必须 能 够 捕获 异常 , 并 在 清理 遗留 故障 后 继续 运行 。 

在 现在 的 计算 如 程序 中 ,所 有 错误 都 表示 为 异 第 ,由 main( ) 函数 处 理 。 如 果 我 们 希望 加 人 错 
误 恢复 功能 , 必须 让 calculate( ) 函数 捕获 异常 , 并 在 计算 下 一 个 表达 式 之 前 清理 故障 : 

void calculate() 

{ 


while (cin) 

try 
cout << prompt; 
Token t= ts.getO; 
while (t.kind == print) t=ts.getQ;  / first discard all “prints” 
if (t.kind == quit) return; H quit 
ts.putback(t); 
cout << result << expression( << endj; 

} 

catch (exception& e) { 
cerr << e.what() << endl; / write error message 
clean_up_mess(); 

} 

} 


我 们 简单 地 将 while 循环 代码 块 放 在 try-catch 结构 中 ,try 结构 在 捕获 异常 后 给 出 错误 提示 信息 ， 
并 清理 遗留 故障 。 在 此 之 后 , 程序 如 往常 一 样 继续 运行 。 

“清理 遗留 故障 ”的 必要 性 何在 ? 本质 上 来 说 , 在 错误 处 理 之 后 准备 好 继续 进行 下 面 的 运算 ， 
就 意味 着 与 错误 相关 的 程序 数据 都 已 清理 , 所 有 数据 都 已 处 于 良好 的 、 可 预测 的 状态 。 在 计算 器 
程序 中 ，Token_stream 是 唯一 在 函数 之 外 定义 的 数据 。 因 此 , 我 们 所 要 做 的 就 是 清理 与 错误 表达 
式 相 关 的 所 有 单词 ， 避 免 它 们 弄 乱 下 一 个 表达 式 。 例 如 

1++2*3; 4+5; 
这 将 会 引发 一 个 错误 , 即 第 二 个 ”+ ”触发 异常 之 后 ，Token_stream 的 缓冲 区 中 仍然 保存 着 2 * 3; 
4+5, 对 此 有 两 种 处 理 方式 : 

1) 清除 Token_stream 中 的 所 有 单词 。 

2) 清除 Token_stream 中 与 当前 表达 式 相 关 的 所 有 单词 。 

第 一 种 方式 将 清除 所 有 单词 (包括 4+5;), 而 第 二 种 方式 只 清除 2*3;, 留 下 4 +5, 随后 将 会 
被 计算 。 看 起 来 哪 种 选择 都 是 合理 的 , 但 都 会 让 某 些 用 户 感到 奇怪 。 实 际 上 , 这 两 种 方式 的 实现 
都 比较 简单 , 为 了 简化 测试 , 我 们 选择 第 二 种 处 理 方式 。 

在 碰 到 分 号 之 前 一 直 由 get( ) 函数 读 取 输 入 , 并 编写 如 下 所 示 的 clean_up_mess( ) 函数 : 


void clean_up_mess() / naive 
{ 
while (true) { // skip until we find a print 
Token t = ts.get(); 
if (t.kind == print) return; 
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不 幸 的 是 , 这 种 方式 并 不 能 处 理 所 有 的 情况 。 考 虑 如 下 输入 : 


1@z; 1+3; 

@ 会 导致 程序 执行 while 循环 的 catch 子 句 , 进而 调用 clean_up_mess( ) 函数 查找 下 一 个 分 号 , 然后 
clean_up_mess( ) 函数 调用 get( ) 函数 读 人 字符 z。 由 于 z 不 是 预定 义 的 单词 , 这 引起 了 另 一 个 错 
误 , 程序 转向 到 main( ) 郴 数 中 的 catch(…) 块 ,最 后 导致 程序 结束 。 太 糟糕 了 ! 我 们 还 没有 机 会 
计算 表达 式 1+3 的 值 , 程序 就 退出 了 。 我 们 只 能 再 从 头 开始 ! 

我 们 可 以 尝试 更 精巧 的 try 和 catch 结构 , 但 这 样 会 使 程序 更 加 混乱 。 错 误 处 理 是 程序 设计 中 
比较 困难 的 部 分 ， 而 错误 处 理 过 程 中 发 生 的 错误 就 更 难处 理 。 因 此 , 我 们 需要 设计 一 种 不 用 抛 出 
异常 就 能 够 从 Token_stream 中 清除 字符 的 方法 。 在 计算 侨 程 序 中 ， get( ) 男 数 是 获取 输入 的 唯一 途 
径 , 但 如 我 们 刚刚 所 见 , 它 遇 到 错误 会 抛 出 一 个 异常 。 因 此 , 我 们 需要 设计 一 个 新 的 操作 , 很 明 
显 , 应 该 将 它 放 在 Token_stream 中 ， 


class Token_stream { 


public: 
Token_stream(); // make a Token_stream that reads from cin 
Token get(); // get a Token 
void putback(Token t); // put a Token back 
void ignore(char c); // discard characters up to and including a c 
private: 
bool full; /is there a Token in the buffer? 


Token buffer; //here is where we keep a Token put back using putback() 
}; 


由 于 ignore( ) 函数 需要 检查 Token_stream 的 缓冲 区 , 因此 将 其 定义 为 Token_stream 的 一 个 成 员 函 
数 。 我 们 将 “希望 得 到 的 内 容 ” 作 为 函数 ignore( ) 的 参数 ,因为 毕竟 哪些 字符 可 用 于 错误 恢复 是 上 
层 程 序 的 事情 ，Token_stream 无 需 了 解 。 我 们 将 这 个 参数 设置 为 一 个 字符 , 是 因为 希望 按 原始 字 
符 来 处 理 输入 ,错误 恢复 过 程 中 提取 单词 的 缺点 在 前 面 已 经 看 到 了 。 因 此 有 


void Token_stream::ignore(char c) 
// c represents the kind of Token 
{ 
// first iook in buffer: 
if (full && c==buffer.kind) { 
full = false; 
return; 


} 
full = false; 


// now search input: 
char ch = 0; 
while (cin>>ch) 
if (ch==c) return; 
} 


程序 首先 检查 缓冲 区 ， 如果 缓 冲 区 中 的 字符 就 是 c, 则 丢掉 它 , 结束 函数 ; 否则 一 直 从 cin 中 读 人 入 
字符 ,直到 过 到 c 为 止 。 
现在 , clean_up_mess( ) 盟 数 可 以 简化 为 : 


void clean_up_mess() 


{ 
ts.ignore(print); 


错误 处 理 通 常 是 比较 困难 的 。 由 于 很 难 猜测 程序 到 底 会 出 现 什么 样 的 错误 , 因此 需要 进行 大 量 的 
实验 与 测试 。 编 写 一 个 万 无 一 失 的 程序 对 技术 要 求 很 高 , 业余 程序 员 通常 会 忽略 这 一 方面 ， 因 此 
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高 质量 的 错误 处 理 往往 是 衡量 程序 员 专 业 程 度 的 标志 。 
7.8 变量 


我 们 已 经 对 程序 风格 和 错误 处 理 机 制 进行 了 改进 , 接 下 来 该 回 过 头 进一步 完善 程序 的 功能 
了 。 我 们 现在 已 经 有 一 个 运行 得 相当 好 的 程序 了 , 该 如 何 完善 它 呢 ? 我 们 希望 加 人 的 第 一 个 功能 
是 对 变量 的 支持 , 变量 的 加 入 能 够 令 使 用 者 更 好 地 表示 长 表达 式 。 类 似 地 , 对 于 科学 计算 , 我 们 
希望 支持 内 置 的 命名 常量 , 如 pi 和 e 等 , 就 像 大 多 数 科学 计算 器 那样 。 
增加 变量 和 常量 是 对 计算 器 程序 的 重大 扩展 , 会 涉及 程序 的 大 部 分 代码 , 如果 没有 充分 的 理 
由 和 时 间 , 最 好 不 要 进行 这 种 类 型 的 修改 。 我 们 这 里 为 计算 器 程序 增加 变量 和 常量 的 功能 , 是 因 
为 一 方面 我 们 可 以 借 此 重新 检查 程序 代码 , 另 一 方面 还 可 以 学 习 更 多 的 程序 设计 技巧 。 
7.8.1 变量 和 定义 
很 明显 , 对 于 变量 和 内 置 常 量 来 说 , 最 关键 的 是 保存 (name,value) 对 ,从 而 通过 名 字 来 访问 
相应 的 值 。 可 以 定义 Variable 类 如 下 : 
class Variable { 
public: 
string name; 
double value; 
Variable (string n, double v) :name(n), value(v) { } 
}; 
于 是 我 们 就 可 以 使 用 name 成 员 来 标识 一 个 Variable, 用 value 成 员 存 储 与 name 对 应 的 值 。 这 里 给 
出 的 构造 函数 只 是 为 了 在 使 用 上 符号 表示 更 方便 。 
我 们 应 该 如 何 存储 Variable 对 象 ， 以 便 能 根据 name 来 查找 Variable 并 存 取 对 应 的 值 ? 回顾 一 


下 我 们 所 学 的 程序 设计 工具 , 最 好 的 方法 是 使 用 Variable 向 量 : 


Vector<Variable> var_ table; 
我 们 可 以 在 向 量 var_table 中 存放 任意 多 个 Variable 对 象 ， 当 搜索 某 个 给 定 的 name 时 ， 只 要 顺序 查 
找 向 量 的 每 个 元 素 即 可 。 我 们 可 以 编写 一 个 函数 get_value( ) , 来 实现 查找 给 定 的 name, 并 返回 对 


应 的 值 : 
double get_valuel(string s) 
I return the value of the Variable named s 
{ 
for (int i = 0; ievar_table.size(); ++i) 
if (var_table[lil.name == s) return var_table[i].value; 
error("get: undefined variable ", s); 


} 
因数 代码 很 简单 : 遍历 var_table 中 的 每 个 Variable 对 象 (从 向 量 的 第 一 个 元 素 开 始 , 逐个 元 素 访 
问 , 直至 最 后 一 个 元 素 ), 判断 变量 的 name 成 员 是 否 与 字符 串 参 数 s 匹配 。 若 匹配 , 则 返回 value 
成 员 中 的 值 。 


类 似 地 , 我 们 还 可 以 定义 set_value( ) 函数 实现 对 Variable 的 赋值 : 
void set_valuel(string s, double d) 
I set the Variable named s to d 
{ 
for (int i = 0; ievar_table.size(); ++i) 
if (var_table[i].name == s) { 
var_table[li] .value = d; 
return; 


error("set: undefined variable ", s); 


} 
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现在 可 以 读 写 var_table 中 已 存在 的 变量 (描述 为 Variable) 了, 但 是 如 何 向 var_table 增加 一 个 新 的 
Variable 呢 ? 计算 器 程序 的 使 用 者 应 该 输入 什么 内 容 , 来 定义 一 个 新 的 变量 , 以便 随后 使 用 它 呢 ? 
我 们 可 以 考虑 采用 C++ 的 语法 : 


double var = 7.2; 
这 样 是 可 以 的 , 但 计算 器 程序 中 的 所 有 变量 都 是 double 类 型 的 , 所 以 这 里 的 “double” 是 可 以 省 略 
的 , 变量 的 定义 可 简化 为 : 


Var = 7.2; 


但 是 , 有 时候 不 能 正确 区 分 是 新 变量 声明 还 是 书写 错误 。 例 如 : 
vari=7.2;  // define a new variable called var1 
varl=3.2;  / define a new variable called var2 


很 明显 , 我 们 的 原意 是 var2 =3. 2;, 但 输入 发 生 了 错误 (注释 没有 输入 错 ) 。 对 于 这 种 输入 错误 导 
致 混淆 的 情况 , 我 们 可 以 接受 它 , 但 更 好 的 方式 是 遵循 程序 设计 语言 (如 C++ ) 的 习惯 , 区 分 变量 
的 声明 (包括 初始 化 ) 和 赋值 操作 。 我 们 可 以 使 用 double, 但 是 在 计算 器 程序 中 , 我 们 选择 更 短 的 
关键 字 let 来 定义 变量 一 一 它 实际 上 来 自 更 老 的 程序 设计 语言 。 


jet var = 7.2; 


相关 文法 如 下 : 
Calculation: 
Statement 
Print 
Quit 


Calculation Statement 


Statement: 
Declaration 
Expression 


Declaration: 
"let" Name "=" Expression 


Calculation 是 文法 中 新 增 的 顶层 产生 式 (规则 ), 表示 calculate( ) 函数 中 的 循环 可 以 在 计算 器 程序 
的 一 次 运行 过 程 中 执行 多 次 计算 。 它 依赖 Statement 产生 式 处 理 表达 式 和 声明 。 处 理 Statement 规 
则 的 函数 如 下 : 


double staterment() 
{ 
Token t= ts.get(); 
switch (t.kind) { 
case jet: 
return declaration(); 
default: 
ts.putback(b; 
return expression(); 
} 
} 


现在 可 以 用 statement( ) 替代 calculate( ) 中 的 expression( ) : 


void calculate() 


whiie (cin) 
try { 
cout << prompt; 
Token t = ts.get(); 
while (t.kind == print) t=ts.get(});  / first discard all “prints” 
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if (t.kind == quit) return; NH quit 
ts.putback(t); 
cout << result << statement() << endl; 
} 
catch (exception& e) { 
cerr << e.what() << endl; // write error message 
clean_up_mess(); 
} 


} 
现在 我 们 必须 编写 declaration( ) 函数 , 它 应 该 完成 什么 功能 ? 应 该 保证 在 let 之 后 出 现 的 是 一 个 
Name 接 一 个 = 再 接 一 个 Expression 一 一 也 就 是 语法 所 描述 的 形式 。 应 该 对 name 做 何 处 理 ?” 我 们 
应 该 回回 量 var_table 中 加 入 一 个 Variable 对 象 , 其 中 两 个 成 员 分 别 设置 为 name 的 字符 串 内 容 和 
expression 的 值 。 在 随后 的 表达 式 计算 过 程 中 , 我 们 就 可 以 使 用 get_value( ) 和 set_value( ) 函数 对 
变量 值 进行 读 写 。 然 而 , 在 动手 编写 代码 之 前 , 我 们 应 该 考虑 一 个 问题 一 一 如 何 处 理 一 个 变量 定 
义 两 次 的 情况 ? 例如 : 


let v1 = 7; 
let v1 = 8; 


一 般 把 这 种 重复 定义 作为 错误 来 处 理 , 实际 中 这 往往 是 拼写 错误 所 致 。 如 本 例 , 我 们 实际 上 是 想 
定义 两 个 变量 . 

let v1 = 7; 

let v2 = 8; 


使 用 变量 名 var 及 值 val 定义 一 个 Variable, 从 逻辑 上 应 该 分 成 两 个 部 分 : 

1) 检查 疝 量 var_table 中 是 否 已 经 存在 名 为 var 的 Variable。 

2) 将 (var, val) 加 到 var_table 中 。 

这 里 不 支持 未 初始 化 的 变量 。 我 们 定义 函数 is_declared( ) 和 define_name( ) 分 别 实现 上 述 两 
个 独立 的 逻辑 操作 : 


bool is_declared(string var) 
/is var already in var_tabje? 





{ 
for (int i = 0; i<var_table.size(); ++i) 
if (var_tablefil.name == var) return true; 
return false; 
} 


double define_namet(string var, double vaj) 
// add (var,val) to var_table 


{ 
if (is_declared(var)) error(var,” declared twice"); 
var_table.push_back(Variable(var,val)); 
return val; 
} 
可 以 通过 回 量 的 成 员 图 数 push_back( ) 将 一 个 新 的 Variable 添加 到 vector < Variable > 向 
量 中 : 


var_table.push_back(Variable(var,val)); 
其 中 ，Variable( var, val) 使 用 参数 var 和 val 构造 一 个 Variable 对 象 , 然后 push_back( ) 将 它 添加 到 
回 量 var_table 的 末尾 。 假 设 我 们 已 经 能 够 处 理 let 和 name 单词 ， 可 以 直接 得 到 函数 declaration( ) 
的 实现 : 


double declaration() 
//assume we have seen “Jet” 
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/ handle: name = expression 
// declare a variable called “name” with the initial value “expression” 


Token t = ts.get(); 
if (t.kind 1= name) error ("name expected | in declaration')， 
string var_name = t.name; 


Token 2 = ts.get(); 
if (2.kind != '=') error("= missing in declaration of ", var_name); 


double d = expression(); 
define_namel(var_name,d); 
return d; 


} 
注意 , 我 们 在 函数 末尾 返回 了 新 变量 的 值 ， 当 初始 化 表达 式 比 较 复杂 时 ,这 种 方式 是 比较 有 用 的 ， 
例如 : 

jet v = d/(t2-t1); 
这 个 声明 语句 定义 了 变量 v 并 打印 它 的 值 。 打 印 声明 变量 的 值 简化 了 caleulate( ) 函数 的 代码 ， 因 
为 这 样 每 个 statement( ) 函数 就 都 会 返回 一 个 值 。 一 般 原则 会 保持 代码 简单 ， 而 特殊 情况 会 使 问题 
变 得 复杂 。 

这 种 跟踪 变量 的 机 制 通常 称 为 符号 表 ( symbol table) ,如果 使 用 标准 库 中 的 map 的 话 ,这 部 分 
代码 会 得 到 极 大 的 简化 (参见 21. 6. 1 节 )。 
7.8.2 引入 单词 name 

到 现在 为 止 , 我 们 已 经 对 程序 进行 了 很 好 的 改进 , 但 很 遗憾 , 它 还 不 能 正常 运行 。 这 并 不 意 
外 , 我 们 对 程序 下 的 “第 一 刀 ” 是 不 会 正常 工作 的 , 因为 我 们 甚至 还 没有 完成 程序 一 程序 还 无 法 
通过 编译 。 程 序 还 不 能 识别 单词 '=', 但 这 可 以 通过 在 Token_stream :: get( ) 中 添加 一 种 情况 处 理 
来 简单 实现 。 但 是 对 于 单词 let 和 name, 必须 修改 get( ) 函数 来 识别 这 些 单词 ,一 种 实现 如 下 : 


const char name = 'a'; // name token 
const char let = 'L'; / declaration token 
const string declkey = "let"; // declaration keyword 


Token Token_stream: :get() 


if (full) { full=false; return buffer; } 
char ch; 
Cin >> ch; 
switch (ch) { 
// as before 
default: 
if (isalpha(ch)) { 
cin.putback(ch); 
string s; 
cin>>s; 
if (s == declkey) return Token(let); // declaration keyword 
return Token(name,s); 


} 

error("Bad token’); 
} i 
} 


首先 请 注意 防 数 调用 isalpha( ch), 它 用 来 检测 输入 ch 是 否 为 字符 。isalpha( ) 是 一 个 标准 库 肾 数 ， 
包含 在 头 文件 std_lib_facilities. h 中 。 更 多 的 字符 分 类 函数 的 内 容 可 以 参考 11.6 节 。 识 别 变量 名 
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与 识别 数字 的 方法 是 相同 的 : 找到 一 个 正确 类 别 的 字符 (这 里 是 一 个 字母 ) 以 后 , 使 用 putback( ) 
函 数 把 它 退 回 , 然后 使 用 >> 读 取 整个 变量 名 。 
不 幸 的 是 , 程序 还 是 不 能 通过 编译 ， 因 为 Token 无 法 存储 一 个 字符 串 , 编译 器 不 能 识别 Token 
(name, s)。 不 过 , 通过 修改 Token 的 定义 就 可 以 解决 这 个 问题 : 
class Token { 
public: 
char kind; 
double value; 
string name; 
Token(char ch) :kind(ch), value(0) { } 
Token(char ch, double val) :kind(ch), value(val) { } 
Token(char ch, string n) :kind(ch), name(n) {} 
}; 
这 里 用 字符 'L' 表 示 单 词 let, 字符 串 “let” 作 为 关键 了 字 。 很 明显 , 将 关键 字 改 为 double、var、# 或 者 
其 他 任何 字符 串 都 是 很 容易 的 ， 只 要 将 declkey 的 值 改 为 想 要 的 字符 串 ，get( ) 函数 中 读 人 名 字 s 
后 与 declkey 比较 , 就 能 识别 出 相应 的 关键 字 。 
现在 重新 运行 程序 , 如果 输入 下 列表 达 式 , 程序 能 够 正常 运行 : 
ietx=3.4; 
fe 
x+y*2; 
但 是 , 程序 不 能 正确 计算 下 列表 达 式 : 
let x = 3.4; 
let y= 2; 
x+y*2; 
两 个 例子 有 什么 差别 吗 ? 让 我 们 仔细 检查 一 下 发 生 了 什么 情况 。 
问题 在 于 我 们 定义 Name 时 太 马 虎 了 , 甚至 “忘记 ”了 征 义 Name 的 产生 式 ( 参 见 7.8.1 节 )。 
根据 现 有 的 文法 , 什么 样 的 字符 可 以 作为 名 字 的 一 部 分 呢 ? 字母 ? 当然 可 以 。 数 字 呢 ? 也 可 以 ， 
ie。 那么 下 划 线 呢 ?“ +” 呢 ?应 该 是 不 允许 的 , 但 我 们 的 程序 没有 正确 
理 它们 。 我 们 还 是 回 过 头 来 认真 检查 一 下 代码 取 。 当 读 和 人 首 字母 以 后 , 我 们 用 > > 读 和 人 一 个 字 
2 这 会 把 空格 以 前 的 所 有 字符 都 读 取 到 字符 串 中 。 也 就 是 说 , x +y* 2j; 虽 然 是 一 个 表达 式 ， 
ed 甚至 分 号 也 成 了 变量 名 的 一 部 分 。 这 显然 不 是 我 们 的 本 意 , 也 是 
无 法 接受 的 。 
我 们 应 该 如 何 修正 这 个 错误 呢 ?” 首 先 , 我 们 必须 精确 地 定义 name 是 什么 ; 然后 , 我 们 必须 修 
改 get( ) 函数 来 实现 name 的 读 取 。 一 个 可 行 的 name 的 定义 如 下 ; 以 字母 开头 的 字母 /数字 串 ， 则 
下 面 的 字符 串 都 是 name; 
ab 
al 


Z12 
asdsddsfdfdasfdsa434RTHTD12345dfdsa8fsd888fadsf 


而 下 面 的 字符 串 都 不 是 : 


1a 
as_s 
# 

Aas 率 

a Car 


当然 , 按 C++ 的 语法 ,as_s 是 一 个 合法 的 name。 可 将 get( ) 函数 的 default 项 修改 如 下 : 
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default: 
if (isalpha(ch)) { 
string s; 
s += ch; 
while (cin.get(ch) && (isalpha(ch) jj isdigit(ch))) s+=ch; 
cin.putback(ch); 
if (s == declkey) return Token(let); // deciaration keyword 
return Token(name,s); 


error("Bad token"); 

新 的 代码 , 将 原来 直接 将 字符 串 读 入 s 的 方式 , 改 为 不 断 读 人 字符, 只 要 是 字母 或 数字 , 就 添加 到 
s 的 末尾 (语句 s+ = ch 表示 将 字符 ch 添加 到 字符 串 s 的 末尾 ) 。while 语句 看 起 来 很 奇怪 : 

while (cin.get(ch) && (isalpha(ch) || isdigit(ch)) s+=ch; 
这 条 语句 中 使 用 cin 的 成 员 函 数 get( ) 读 一 个 字符 到 ch, 并 检查 是 否 为 字母 或 数字 。 如 果 是 , 就 将 
ch 添加 到 s 的 末尾 , 然后 继续 读 人 下 一 个 字符 。 成 员 隆 数 get( ) 与 >> 的 作用 相似 , 只 是 它 默 认 情 
况 下 不 会 在 遇 到 空格 时 停止 。 
7.8.3 预定 义 名 字 


现在 程序 已 经 支持 名 字 了 , 我 们 可 以 预定 义 一 些 常 用 的 名 字 。 例 如 , 假如 我 们 的 计算 器 程序 
用 于 科学 计算 , 那么 我 们 可 能 需要 预定 义 pi 和 e。 我 们 应 该 在 程序 中 什么 位 置 放 置 这 些 定 义 ? 可 
以 放 在 main( ) 函数 中 的 caleulate( ) 渔 数 调用 以 前 , 或 者 放 在 calculate( ) 盟 数 中 的 计算 循环 之 前 。 
由 于 这 些 定 义 不 是 任何 表达 式 计 算 的 组 成 部 分 ,因此 可 以 将 它们 放 在 main( ) 郴 数 中 。 


int main() 

try { 
/ predefine names: 
define_name("pi",3.1415926535); 
define_name("e’,2.7182818284); 


calculate(); 


keep_window_open(); / cope with Windows console mode 
return 0; 


catch (exception& e) { 
cerr << e.what() << endl; 
keep_window_open("~~"); 
return 1; 


} 

catch (,..) { 
Cerr << "exception my; 
keep_window_open("~~"); 
return 2， 


} 
7. 8.4 我 们 到 达 目 的 地 了 吗 

显然 没有 , 在 对 程序 做 了 诸多 修改 以 后 , 还 需要 对 程序 进行 测试 、 清理 代 码 和 修改 注释 等 。 
而 且 , 还 可 以 定义 更 多 的 操作 和 变量 。 例 如 , 我 们 还 没有 在 程序 中 提供 赋值 操作 符 ( 参 见 练习 2 ) ， 
如 果实 现 执 行 赋值 操作 的 话 , 我 们 还 应 该 区 分 变量 和 常量 (参见 练习 3) 。 
我 们 先 回 到 最 初 不 支持 命名 变量 的 计算 器 程序 , 仔细 回顾 一 下 实现 命名 变量 功能 的 代码 , 可 

能 会 有 两 种 不 同 的 反应 : 

1) 实现 变量 并 不 那么 糟 , 大 概 用 三 十 几 行 代码 就 可 以 了 。 
2) 实现 变量 是 一 个 重大 的 扩展 , 几乎 涉及 每 个 函数 ,并且 在 计算 器 程序 中 引入 了 一 个 全 新 的 
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概念 。 在 没有 实现 赋值 操作 的 情况 下 ,代码 量 已 经 增加 了 大 约 45951 
计算 器 程序 是 我 们 第 一 个 比较 复杂 的 程序 ,站 在 这 个 角度 来 看 , 第 二 种 反应 是 比较 合理 的 。 


一 般 来 说 , 如 果 一 个 改进 程序 的 建议 会 使 程序 的 代码 量 和 复杂 度 增加 50%% 左 右 , 第 二 个 反应 是 很 
正常 的 。 如 果真 按 这 样 的 建议 去 做 了 , 你 会 发 现 整个 过 程 更 像 是 基于 原来 版 本 重 写 了 一 个 新 的 程 
序 。 而 且 , 你 最 好 就 把 这 个 过 程 当 做 重 写 程序 来 对 符 , 这 样 会 有 更 好 的 效果 。 特 别 地 ,如 果 我 们 
能 够 分 阶段 编写 和 测试 程序 ,就 像 设计 计算 器 程序 这 样 , 我 们 最 好 就 这 么 做 , 这 比 一 下 子 就 编写 
完整 的 程序 要 好 得 多 。 


全 》 简单 练 习 


下 
2. 


从 程序 calculator08buggy. cpp 开始 , 修改 其 中 的 错误 , 使 之 能 编译 通过 。 
阅读 整个 计算 器 程序 并 添加 适当 的 注释 。 


3. 你 会 发 现 程序 中 存在 一 些 错误 (我 们 特意 加 入 了 一 些 不 明显 的 错误 让 你 来 查找 ), 这些 错误 都 未 在 本 章 中 


Ln 


出 现 过 , 尝试 修正 它们 。 


. 测试 ; 准备 一 组 测试 数据 , 用 来 测试 计算 器 程序 。 要 注意 测试 用 例 的 完整 性 , 思考 你 要 通过 测试 用 例 查 


找 什 么 ? 测试 用 例 应 包括 负数 、0、 非常 小 的 数 、 非 常 大 的 数 和 一 些 “ 轧 鹤 " 输 入 。 


， 进行 测试 , 并 修改 在 阅读 代码 过 程 中 没有 发 现 的 错误 。 


6. 增加 一 个 预定 义 名 字 k, 其 值 为 1000。 


oo 


. 为 用 尸 提供 平方 根 阔 数 sqrt( ) ， 如 允许 用 户 计算 sqrt(2 +6.7)。sqrt(x) 的 值 是 x 的 平方 根 , 例如 sqrt(9) 


的 值 为 3。 使 用 标准 库 函 数 sqrt( ) 完成 平方 根 的 计算 , 这 个 函数 包含 在 头 文件 std_lib_facilities. h 中 。 记 得 
更 新 程序 代码 注释 以 及 文法 。 


.捕获 求 负数 的 平方 根 的 异常 , 并 给 出 适当 的 错误 信息 。 


9. 增加 本 函数 pow(x, i) ,例如 pow(2.5, 3) 表 示 2.5*2.5*2.5, 要 求 i 为 整数 , 可 使 用 与 % 运算 符 相 同 的 


10. 
11. 


方法 处 理 。 

将 “声明 关键 字 ”let 改 为 #。 

将 “退出 关键 字 ”q 改 为 exit， 与 “let" 的 处 理 一 样 , 我 们 需要 定义 一 个 表示 “退出 "的 字符 串 , 参见 
B22 


过》 思考 题 


DE 


. 为 什么 还 要 对 程序 的 第 一 版 做 这 些 改 进 ? 给 出 几 条 原因 。 
. 为 什么 输入 表达 式 “1 +2;q" 后 , 程序 没有 退出 而 是 给 出 一 个 错误 信息 ? 
. 为 什么 选择 用 一 个 字符 常量 表示 number? 


为 什么 把 main( ) 函数 分 成 两 个 相互 独立 的 部 分 , 分 别 实现 了 什么 功能 ? 


. 为 什么 把 程序 代码 分 成 若干 个 小 函数 ? 试 阐明 划分 原则 。 
. 代码 注释 的 目的 是 什么 ?如 何 为 程序 增加 注释 ? 


narrow_cast 的 作用 是 什么 ? 


. 符号 常量 的 用 途 是 什么 ? 

. 为 什么 关心 代码 布局 ? 

， 如何 处 理 浮 点 数 的 模 运 算 (% )? 

，is_declared( ) 函数 的 功能 是 什么 ? 它 是 如 何 工作 的 ? 

: let 单词 对 应 的 输入 内 容 是 由 多 个 字符 构成 的 , 在 修改 后 的 程序 中 , 如 何 将 其 作为 一 个 单词 读 人 ? 
. 计算 器 程序 中 的 name 可 以 是 什么 形式 , 不 能 是 什么 形式 , 对 应 的 规则 是 怎样 的 ? 

. 为 什么 说 以 增 量 方式 设计 程序 是 一 个 比较 好 的 主意 ? 

. 什么 时 候 开 始 对 程序 进行 测试 ? 

， 什 么 时 候 对 程序 进行 再 测试 ? 

.如何 决定 函数 的 划分 ? 
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18. 为 什么 添加 代码 注释 ? 
19. 注释 中 应 该 写 些 什么 内 容 , 不 应 该 写 什 么 内 容 ? 
20. 什么 时 候 可 以 认为 已 经 完成 了 一 个 程序 ? 


忆 》 术语 


代码 布局 程序 维护 程序 框架 注释 错误 恢复 
符号 常量 错误 处 理 版 本 历史 测试 功能 幕 延 


全 》 习 是 


1 
pk 
3. 


Cn 


vv 


9. 


修改 计算 器 程序 , 允许 名 字 中 出 现下 划 线 。 

提供 赋值 操作 符 ” = ”, 以 便 在 let 定义 变量 后 能 够 修改 其 值 。 

提供 命名 常量 一 一 不 允许 更 改 其 值 。 提 示 : 在 Variable 中 增加 一 个 用 于 区 分 常量 和 变量 的 成 员 , 并 根据 
该 成 员 判 断 set_value( ) 是 否 允许 执行 。 如 果 允 许 用 户 定义 常量 (而 不 是 计算 器 程序 中 预定 义 的 pi 和 e 那 
样 的 常量 ) ， 必 须 增加 一 个 符号 , 用户 可 用 其 表达 常量 定义 , 例如 用 “const” 表 示 常 量 定义 : const 
pi=3. 14;。 





， get_value( ) 、set_value( ) 、is_declared( ) 和 declare_name( ) 等 一 数 都 可 以 操作 全 局 变量 var_table。 定 义 一 


个 Symbol_table 类 , 其 成 员 为 vector < Variable > 类 型 的 var_table, 成 员 函 数 为 get( ) 、set( ) 、is_declared( ) 
和 declare( ) , 并 使 用 该 类 重新 编写 计算 器 程序 。 


.修改 Token_stream :: get( ) 函数 ,在读 到 换行 时 返回 单词 print。 这 就 需要 寻找 空格 并 对 换行 (“\n” ) 进 行 特 


殊 处 理 。 可 以 使 用 标准 库 函 数 isspace( ch) ， 当 ch 为 空格 时 返回 真 值 。 


.每 个 程序 都 应 该 具有 给 用 户 提供 帮助 信息 的 功能 , 修改 计算 器 程序 ， 当 用 户 输入 “H” (大写 或 小 写 均 可 ) 


时 能 够 显示 帮助 信息 。 


.将 命令 符 “q” 和 “h” 分 别 改 为 “quit” 和 “help”。 
- 7.6.4 节 给 出 的 文法 是 不 完整 的 (我 提醒 过 你 不 要 过 分 依赖 注释 ) , 没有 定义 语句 序列 , 例如 4+4; 5 -6;, 也 不 


包括 7.8 节 对 文法 所 做 的 改进 。 修 改 文法 , 并 为 注释 添加 你 认为 必要 的 内 容 。 
定义 一 个 Table 类 , 其 成 员 为 vector < Variable > 类 型 的 变量 , 成 员 肾 数 为 get( ) 、set( ) 和 declare( ) ， 并 在 
计算 器 程序 中 用 Table 类 对 象 symbol_table 替换 var_table。 


10. 为 计算 器 程序 提出 三 种 本 章 没 有 提 及 的 改进 , 并 实现 其 中 的 一 种 。 

11. 修改 计算 器 程序 , 使 其 仅仅 能 处 理 整数 , 并 在 发 生 上 滋 和 下 溢 时 给 出 错误 信息 。 

12. 实现 赋值 操作 符 , 以便 能 修改 初始 化 以 后 的 变量 的 值 。 试 讨论 赋值 操作 符 的 用 处 以 及 可 能 引起 的 问题 。 
13. 回顾 你 在 做 第 4 章 和 第 5 章 习 题 时 所 编写 的 两 个 程序 , 根据 本 章 给 出 的 原则 清理 代码 , 看 看 在 这 个 过 程 


中 能 和 否 发 现 错误 。 


<》 附 言 


很 偶然 地 , 我 们 通过 一 个 简单 的 例子 了 解 了 编译 器 是 如 何 工作 的 。 计 算 器 程序 分 析 输 入 流 , 将 其 分 解 


为 单词 , 并 根据 文法 规则 理解 其 意义 。 这 正 是 编译 器 所 做 的 工作 。 在 分 析 了 前 面 阶段 的 输入 之 后 , 编译 强 
将 生成 另外 一 种 形式 的 描述 ( 目标 代码 ) ， 可 供 随后 执行 。 而 计算 器 程序 分 析 了 表达 式 的 含义 后 , 会 立刻 计 
算 其 值 , 这 种 程序 一 般 称 为 解释 器 ， 而 不 是 编译 需 。 


第 8 章 ” 涵 数 相关 的 技术 细 访 


“再 多 的 天 赋 也 战胜 不 了 对 细节 的 偏执 。 


一 一 俗语 





在 本 章 和 第 9 章 中 , 我 们 将 注意 力 从 程序 设计 转移 到 我 们 主要 的 编程 工具 一 一 C++ 上。 我们 
会 介绍 一 些 语言 的 技术 细节 , 来 给 出 一 个 C++ 的 基本 功能 的 稍 宽 的 视角 , 并 从 更 系统 化 的 角度 讨 
论 这 些 功 能 。 这 两 章 还 会 回顾 很 多 前 面 章节 介绍 过 的 程序 设计 概念 , 并 提供 一 个 研究 语言 工具 的 
机 会 , 这 两 章 不 介绍 新 的 程序 设计 技术 和 概念 。 


8. 1 技术 细节 


如 果 可 以 选择 的 话 , 我 们 更 愿意 讨论 程序 设计 , 而 不 是 程序 设计 语言 的 特性 ; 也 就 是 说 , 我 
们 认为 ， 如 何 用 代码 表达 思想 远 比 我 们 用 来 表达 这 些 思想 的 程序 设计 车 言 技 术 细节 更 有 意思 。 
然 语 言 中 也 有 类 似 的 情况 : 我 们 更 愿意 讨论 一 部 好 的 小 说 中 的 思想 和 它 表 达 这 些 思想 的 方式 ， 而 
不 愿意 研究 其 中 的 语法 和 词汇 。 总 之 , 重要 的 是 思想 和 如 何 用 代码 表达 思想 而 不 是 单独 的 编程 
语言 特性 。 

但 是 , 我 们 不 是 总 可 以 选择 。 当 你 开始 编程 时 ,你 用 的 编程 语言 对 你 而 言 就 是 一 门 外 语 , 你 
必须 学 习 它 的 “语法 和 词汇 表 ”。 这 就 是 本 章 和 第 9 章 要 做 的 事情 , 但 请 不 要 忘记 : 

。 我 们 要 学 习 的 主要 是 程序 设计 。 

。 我 们 生产 的 是 程序 和 系统 。 

。 程序 设计 语言 (只 ) 是 工具 。 

记 住 这 一 点 似乎 极其 困难 , 很 多 程序 员 对 明显 是 编程 语言 语法 和 语义 次 要 细节 的 东西 表现 出 
巨大 的 热情 。 特 别 是 , 很 多 人 有 这 样 一 种 错误 观念 : 他 们 使 用 的 第 一 种 编程 语言 中 的 工作 方法 是 
做 任何 事 的 “不 二 法 门 ”, 请 不 要 掉 人 这 种 陷阱 。C++ 在 很 多 方面 是 一 种 非常 好 的 编程 语言 , 但 它 
并 不 完美 , 任何 其 他 编程 语言 也 都 一 样 。 

大 多 数 程 序 设计 概念 是 通用 的 , 而 很 多 这 种 概念 被 流行 的 程序 设计 语言 所 广泛 支持 。 这 意味 
着 , 我 们 在 一 门 好 的 程序 设计 课 中 学 到 的 基本 思想 和 技术 可 以 从 一 种 编程 语言 延续 到 下 一 种 语 
言 。 也 就 是 说 , 它们 可 以 (不 同 程度 地 ) 方 便 地 用 于 所 有 语言 。 而 编程 语言 的 技术 细节 , 则 只 限于 
特定 的 语言 。 举 运 的 是 , 编程 语言 不 是 在 真空 中 设计 出 来 的 , 因此 你 在 这 里 学 到 的 很 多 内 容 都 会 
在 其 他 博 言 中 找到 明显 的 对 应 内 容 。 特 别 是 C++ 与 C( 参 见 第 27 章 )、Java 和 C# 属 于 同一 类 语 
言 , 它们 具有 相当 多 的 共性 。 

注意 ， 当 讨论 语言 技术 问题 时 , 我 们 故意 使 用 非 描述 性 的 命名 , 如 f、g、X 和 y。 我 们 这 样 做 
是 为 了 强调 这 些 例子 的 技术 性 质 , 保证 这 些 例子 很 简短 ,以 及 尽力 避免 将 语言 技术 细节 和 真正 的 
程序 设计 方法 混淆 而 令 你 困惑 。 当 你 看 到 非 描述 性 的 名 字 ( 例 如 那些 永远 不 应 该 用 在 真实 代码 中 
的 名 字 ) 时 ,请 将 注意 力 放 在 代码 的 语言 技术 层面 上 来 。 典 型 的 语言 技术 实例 由 仅仅 用 来 展示 语 
言 规则 的 代码 组 成 。 如 果 你 编译 并 运行 这 些 代码 , 你 会 得 到 很 多 “变量 未 使 用 ”的 警告 , 而 这 样 的 
技术 性 程序 片段 很 少 具有 实用 意义 。 


请 注意 我 们 在 本 章 介 绍 的 内 容 不 是 C++ 语 法 和 语义 的 完整 描述 , 甚至 不 是 我 们 介绍 过 的 
C++ 功能 的 完整 描述 。ISO C++ 标准 的 篇 幅 有 756 页 , 充满 星 汲 的 技术 语言 ; 而 Stroustrup 所 著 的 
《The C++ Programming Language》 一 书 有 1000 多 页 , 针对 的 是 有 经 验 的 程序 员 。 本 书 不 会 在 完备 
性 和 综合 性 方面 与 它们 一 争 高 下 ,本 书 的 优势 是 犁 懂 , 值得 阅读 。 


8.2 声明 和 定义 


声明 (declaration ) 语句 将 名 字 引 人 作用 域 ( 参 见 8.4 节 ), 其 作用 是 : 

。 为 命名 实体 (如 变量 、 函 数 ) 指定 一 个 类 型 。 

。 (可 选 ) 进 行 初始 化 (例如 , 为 变量 指定 一 个 初始 值 或 为 函数 指定 函数 体 ) 。 
下 面 即 为 声明 语句 的 例子 : 


inta=7; // an int variabje 


const double cd = 8.7; /a double-precision floating-point constant 
double sqrt(double); //a function taking a double argument 
// and returning a double result 
vector<Token> v; // a vector-of-Tokens variable 
C++ 程序 中 的 名 字 都 必须 先 声明 后 使 用 。 考 虑 下 面 代码 : 
int main() 
《 


cout << ff(i) << \n'; 


} 
编译 器 最 少 会 给 出 三 个 “未 声明 的 标识 符 ” 的 错误 , 因为 在 此 程序 片段 中 任何 地 方 都 没有 cout、f 
和 i 的 声明 。 我 们 可 以 通过 包含 头 文件 std-lib-facilities. h 得 到 cout 的 声明 ;。 


#include "std lib _facilities.h” //we find the declaration of cout in here 


int main() 
{ 
cout << fi) << \n'; 


} . 
现在 ， 只 剩 两 个 “未 定义 "错误 了 。 当 编写 实用 程序 时 ,你 会 发 现 大 多 数 声明 都 是 在 头 文件 中 给 出 
的 。 一 般 来 说 , 对 于 在 “其 他 地 方 " 定 义 的 有 用 的 功能 , 可 以 在 头 文件 中 为 其 定义 接口 。 大 致 来 
说 , 一 个 声明 定义 了 一 些 功能 的 使 用 方式 , 也 就 是 定义 了 函数 、 变 量 或 类 的 接口 。 请 注意 声明 的 
这 种 用 途 有 一 个 明显 的 但 易 被 忽视 的 优点 : 我 们 不 必 了 解 cout 及 其 << 操作 符 的 定义 的 细节 , 我 
们 只 需 用 失 nclude 包含 它们 的 声明 即 可 。 我 们 甚至 无 需 真正 了 解 它们 的 声明 , 从 教材 、 手 册 、 代 码 
实例 或 其 他 资料 中 了 解 cout 应 如 何 使 用 就 够 了 。 编 译 磊 会 读 取 头 文件 中 的 声明 , 以便” 理解 “我 
们 的 程序 。 

现在 , 我 们 还 需要 声明 f 和 i, 可 以 这 样 做 : 

#include "std_lib_facilities.h" /we find the deciaration of cout in here 


int f(int); // declaration of f 


int main'() 
{ 
intis=7; // declaration of i 
cout << fi << \n'; 
} 


这 段 代码 就 可 以 编译 通过 了 ,， 因为 每 个 名 字 都 已 经 声明 过 了 , 但 还 会 连接 失败 (参见 2.4 节 ) ， 因 
为 我 们 还 没有 定义 函数 f( ) ; 也 就 是 说 , 我 们 还 没有 指出 f( ) 实际 上 应 该 做 什么 。 
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如 果 一 个 声明 (还 ) 给 出 了 声明 的 实体 的 完整 描述 , 我 们 则 称 之 为 定义 (definition) 。 
下 面 是 一 个 定义 的 例子 : 


inta=7; 
vector<double> v; 
double sqrt(double d) {/* ...*/} 


每 个 定义 同时 也 是 一 个 声明 , 但 某 些 声 明 不 是 定义 。 下 面 列 出 一 些 不 是 定义 的 声明 , 每 个 声明 都 
需要 在 代码 的 其 他 位 置 给 出 对 应 的 定义 。 


double sqrt(double); WA no function body here 
extern int a; // “extern plus no initializer” means “not definition” 


当 我 们 对 比 定义 和 声明 时 , 我 们 按 惯例 用 “声明 ”表示 “不 是 定义 的 声明 ”,， 即使 这 有 点 不 那 
么 严谨 。 
一 个 定义 确切 指明 了 一 个 名 字 代 表 什 么 。 特 别 地 , 一 个 变量 定义 会 为 该 变量 分 配 内 存 空间 。 


因此 , 你 不 能 重复 定义 茶 个 名 字 , 例如 : 


doubie sqrt(double d) {/*...*/} / definition 
double sqrt(double d) {/* ...*/} /error: double definition 


inta;  / definition 
inta;  //error: double definition 


相反 ,一 个 非 定 义 声明 仅仅 告诉 你 如 何 使 用 一 个 名 字 , 它 只 是 一 个 接口 , 不 会 为 变量 分 配 内 存 空 
间或 为 函数 指定 函数 体 。 因 此 , 你 可 以 声明 一 个 名 字 任 意 多 次 ,只 要 一 致 即 可 : 


intx= 7; // definition 

extern int x; // declaration 

extern int x; // another declaration 

double sqrt(double); // declaration 

double sqrt(double d) {/*...*/} / definition 

double sqrt(double); // another declaration of sqrt 

double sqrt(double); // yet another declaration of sqrt 

int sqrt(double); // error: inconsistent declarations of sqrt 


最 后 一 个 声明 为 什么 是 错误 的 ? 因为 不 允许 有 两 个 函数 都 叫 sqrt, 接受 一 个 同样 是 double 类 型 的 
参数 , 但 却 返 回 不 同类 型 的 值 (int 和 double) 

x 的 第 二 个 声明 中 使 用 的 关键 字 exterm 表示 此 声明 不 是 一 个 定义 。 这 个 关键 字 几 乎 没什么 用 
处 , 我 们 建议 你 不 要 使 用 它 , 但 是 你 会 在 别人 的 代码 中 看 见 它 , 特别 是 那些 使 用 了 非常 多 全 局 变 
量 的 代码 (参见 8.4 节 和 8. 6.2 节 )。 z 


声明 : 定义 : 
doublte sqrt(double d) double sqrt(double d) 
















double sqrtidouble o) 0 


> G 





intx=7; ~ 


为 什么 C++ 既 提 供 声 明 功 能 ,又 提供 定义 功能 呢 ? 这 两 者 间 的 区 别 反 映 出 "如何 使 用 
一 个 实体 (接口 ) "与 “这 个 实体 如 何 完成 它 应 该 做 的 事情 (实现 ) ”之 间 的 根本 区 别 。 对 于 一 
个 变量 来 说 ,其 声明 仅仅 提供 了 类 型 ， 只 有 定义 才能 提供 对 象 ( 内 存 空间 ) 。 对 于 一 个 函数 
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来 说 , 其 声明 也 是 只 提供 了 类 型 (参数 类 型 和 返回 类 型 ), 只 有 定义 才 提 供 喇 数 体 ( 可 执行 的 
语 名 )。 注 意 , 函数 体 是 作为 程序 的 一 部 分 保存 在 内 存 中 的 , 因此 可 以 说 函数 和 变量 定义 消 
耗 了 内 存 , 而 声明 却 没有 。 

声明 和 和 定义 之 间 的 区 别 使 我 们 可 以 将 一 个 程序 分 为 很 多 部 分 , 分 开 编译 。 声 明 功 能 使 程序 的 
每 个 部 分 都 能 保有 程序 其 他 部 分 的 一 个 视图 ， 而 不 必 关 心 其 他 部 分 中 的 定义 。 所 有 声明 (包括 唯 
一 的 那个 定义 ) 必须 一 致 ， 而 整个 程序 中 实体 的 命名 也 应 该 一 致 。 我 们 将 在 8. 3 节 中 进一步 讨论 
这 个 问题 。 在 此 , 我 们 只 是 提醒 你 回顾 一 下 第 6 章 中 的 表达 式 分 析 器 : 其 中 expression( ) 调用 
term( ) ，term( ) 调用 primary( ) ， 而 primary( ) 又 调用 了 expression( ) 。 由 于 在 C++ 程序 中 每 个 名 字 
都 要 先 声 明 再 使 用 , 所 以 简单 地 定义 这 三 个 函数 是 行 不 通 的 : 


double expression(); /just a declaration, not a definition 
double primary() 
{ 
ll... 
expression(); 
1/... 
} 


double term() 


{ 
Wi 


primary(); 
Wa 
} 


double expression() 


我 们 可 以 按 任意 顺序 排列 这 四 个 卫 数 , 无 论 如 何必 然 会 有 一 个 隔 数 调用 在 其 后 定义 的 消 数 。 这 
里 , 我 们 需要 “前 置 声明 ”(forward declaration)。 因 此 , 在 primary( ) 的 定义 前 声明 expression( ) ,这 
样 就 一 切 顺 利 了 。 在 实际 编程 中 , 这 种 循环 调用 非常 第 见 。 

为 什么 名 字 需 要 在 使 用 前 声明 呢 ? 为 什么 我 们 不 能 要 求 编译 器 通过 读 程序 (就 像 我 们 做 的 那 
样 ) 找 出 定义 , 来 获得 函数 应 该 如 何 调用 的 信息 呢 ? 我们 当然 可 以 这 样 要 求 , 但 这 会 导致 有趣” 
的 技术 问题 , 所 以 我 们 决定 不 这 样 做 。C ++ 规范 要 求 声 明 在 使 用 前 定义 (类 成 员 除外 , 参见 9.4.4 
节 ) 。 毕 竟 , 这 种 方式 已 经 是 一 般 写作 (不 是 编写 程序 ) 的 惯例 了 : 当 你 阅读 一 本 教材 时 , 你 当然 
希望 作者 在 使 用 一 个 术语 之 前 先 定义 它 ; 否则 , 你 不 得 不 一 直 去 猜测 术语 的 含义 或 去 查 索引 。 无 
论 是 对 人 还 是 编译 器 ,“ 先 声明 后 使 用 ”的 原则 简化 了 阅读 。 在 一 个 程序 中 ,“ 先 使 用 后 定义 "之 所 
以 重要 还 有 另外 一 个 原因 。 在 一 个 几 千 行 ( 甚 至 几 十 万 行 ) 的 程序 中 , 很 多 我 们 希望 调用 的 函数 都 
是 在 “别处 ”定义 过 的 。 而 这 个 “别处 ”, 我 们 往往 不 希望 知道 到 底 是 娜 。 只 需 了 解 我 们 使 用 的 实 
体 的 声明 , 把 编译 器 从 阅读 大 量程 序 文本 中 解脱 出 来 。 
8. 2. 1 声明 的 类 别 

C++ 人 允许 程序 员 定 义 很 多 类 别 的 实体 , 我 们 比较 关心 的 有 : 

。 变量 

。 常量 
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e 函数 (参见 8.5 节 ) 
。 命名 空间 (参见 8.7 节 ) 
。 类 型 (类 和 枚 举 , 参见 第 9 章 ) 
。 模板 (参见 第 19 章 ) 
8. 2.2 ”变量 和 营 量 声明 
一 个 变量 或 常量 声明 需 指定 名 字 和 类 型 , 并 可 进行 初始 化 。 例 如 : 
int a; I no initializer 


double d = 7; I initializer using the = syntax 
vector<int> vi(10); /initializer using the () syntax 
你 可 在 Stroustrup 的 《The C++ Programming Language》 一 书 中 和 1ISO C++ 标 准 中 找到 变量 和 常量 声 
明 的 完整 语法 。 
常量 声明 的 语法 与 变量 声明 一 样 , 差别 在 于 类 型 之 前 多 了 一 个 关键 字 const， 而 且 必须 进行 初 
始 化 : 
constintx=7; Winitializer using the = syntax 
const int x2(9); ”Winitializer using the () syntax 
const int y; I error: no initializer 
必须 进行 初始 化 的 原因 是 显然 的 : 如 果 一 个 常量 没有 值 的 话 ,， 它 何 以 为 常量 呢 ? 对 变量 也 进行 初 
始 化 通常 是 个 好 主意 , 未 初始 化 的 变量 常会 导致 隐蔽 的 错误 。 例 如 : 
void flint z) 
{ 
int x; /uninitialized 
I . . . no assignment to x here ... 
X=7; /givexa value 


} 
这 段 代码 看 起 来 再 正常 不 过 了 , 但 如 果 在 第 一 个 “…" 处 包含 对 x 的 使 用 又 如 何 呢 ? 例如 : 
void f(int z) 
{ 
intx; /uninitialized 
I .. .noassignment to x here ... 
if (zx) { 
a 
} 
a 
x=7; //give x a value 
} 


因为 x 未 初始 化 , 所 以 执行 :>x 的 结果 是 未 定义 的 。 在 不 同 的 机 器 平台 上 ,比较 操作 z>x 
会 给 出 不 同 的 结果 , 甚至 同一 台 机 器 上 执行 多 次 也 会 给 出 不 同 的 结果 。 原 则 上 , z >x 应 导致 
程序 因 一 个 硬件 错误 而 终止 , 但 多 数 时 候 这 不 会 发 生 , 取而代之 的 是 我 们 会 得 到 一 个 不 可 预 
知 的 结果 。 

我 们 目 然 不 会 故意 这 人 么 做 , 但 我 们 可 能 犯错 误 , 如 果 没 有 坚持 初始 化 变量 ， 上述 情况 就 
会 发 生 。 记 住 , 很 多 " 昌 玖 的 错误 ”( 比如 对 于 一 个 未 初始 化 的 变量 , 在 对 其 赋值 之 前 就 使 用 
它 ) 虱 是 在 你 很 忙 之 后 疲倦 的 时 候 发 生 的 。 编 译 器 会 尽力 给 出 警告 , 但 对 于 复杂 的 代码 (这 
类 错误 最 可 能 发 生 的 地 方 ) 编译 器 还 无 力 捕捉 所 有 这 种 错误 。 有 的 人 不 习惯 初始 化 变量 , 这 
通常 是 因为 他 们 学 习 程序 设计 所 用 的 语言 不 允许 或 不 鼓励 一 致 的 初始 化 ; 因此 你 会 在 别人 
的 代码 中 看 到 这 样 的 例子 。 请 不 要 因为 忘记 初始 化 你 自己 定义 的 变量 ， 而 向 你 的 程序 中 引 
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入 错误 。 
8.2.3 默认 初始 化 
你 可 能 已 经 注意 到 了 , 我 们 通常 不 对 字符 串 、 向 量 等 对 象 进行 初始 化 。 例 如 : 


vector<string> v; 
string s; 
while (cin>>s) v.push_back(s); 


这 并 不 是 “变量 必须 先 初 始 化 再 使 用 ”这 条 规则 的 例外 情况 。 之 所 以 出 现 这 种 情况 , 是 因为 我 们 定 
义 string 类 和 vector 类 时 定义 了 默认 初始 化 机 制 , 如 果 代 码 中 不 显 式 进行 初始 化 , 这 两 种 对 象 就 会 
被 用 一 个 默认 值 进行 初始 化 。 因 此 ， 上述 代码 执行 到 循环 时 , v 的 值 为 空 (不 包含 任何 元 素 ), s 的 
值 为 空 串 (“”) 。 保 证 默认 初始 化 的 机 制 称 为 默认 构造 函数 ,参见 9.7.3 节 。 

不 幸 的 是 , C++ 不 允许 我 们 对 内 置 类 型 设置 默认 初始 化 功能 。 全 局 变量 会 被 默认 初始 
化 为 0, 但 你 应 该 尽量 少 用 全 局 变量 。 而 最 常 使 用 的 变量 、 局 部 变量 和 类 成 员 ， 是 不 会 被 初 
始 化 的 , 除非 你 提供 相应 的 初始 化 程序 (或 默认 构造 函数 ) 。 我 们 已 经 提示 过 了 ,你 在 实践 
中 一 定 要 注意 ! 


8.3 头 文件 


我 们 如 何 管理 声明 和 定义 呢 ? 这 是 一 个 大 问题 ,因为 声明 和 定义 要 一 致 , 而 实际 程序 
可 能 会 有 数 万 个 声明 , 甚至 几 十 万 个 也 不 罕见 。 一 般 地 ， 当 编写 程序 时 , 我 们 使 用 的 定义 
多 数 都 不 是 我 们 写 的 。 例 如 ，cout 和 sqrt( ) 的 实现 就 是 别人 在 很 多 年 前 写 的 , 我 们 只 是 使 
用 它们 。 

在 C++ 中 , 对 于 “别处 ”定义 的 功能 的 声明 , 管理 它们 的 关键 是 " 头 ”。 本 质 上 , 一 个 头 (head- 
er) 是 一 个 声明 的 集合 , 一 般 定 义 于 一 个 文件 , 因此 也 称 为 头 文 件 (header file) 。 这 样 的 头 文件 用 
#include 包 含 在 我 们 的 源 文件 中 。 例 如 , 我 们 可 能 决定 改进 的 计算 器 程序 (参见 第 6 章 和 第 7 章 ) 
的 源码 组 织 , 将 单词 管理 部 分 分 隔 出 去 。 我 们 可 以 定义 一 个 包含 Token 类 和 Token_stream 类 的 声 
明 的 头 文件 token. h: 


token.h: 


// declarations: 
class Token {/* ... */}; 
class Token_stream {/* ... */}; 























token.cpp: 
#include "token.h" 
//definitions: 

void Token,_stream: :putback(Token t) 
{ 









caiculator.cpp: 
#include "token.h' 
// Uses: 
buffer=t; 


fuji = true; Token_stream ts; | 





Token t={s.get0; 


ts.putback(D); 


Token 和 Token_stream 的 声明 在 头 文件 token. h 中 , 而 它们 的 定义 在 token. cpp 中 。 后 级 .h 通 
常用 于 C++ 头 文件 , 而 . epp 后 缀 通常 用 于 C++ 源 文件 。 实 际 上 , C++ 语言 并 不 关心 文件 
后 缀 , 但 一 些 编译 器 和 很 多 程序 开发 环境 坚持 这 种 命名 习惯 ,因此 你 的 源码 组 织 也 请 遵循 这 
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一 惯例 O 

原则 上 , 检 nclude "file. h" 只 是 简单 地 将 file. h 中 的 声明 复制 到 你 的 文件 中 #include 指令 处 。 
例如 , 我 们 可 以 写 一 个 头 文 件 f.h: 

Ht.h 

int f(int); 


并 将 它 包 含 于 我 们 的 源 文件 user. cpp 中 : 


// user.cpp 
#include "f.h" 
int g(int i) 
{ 

return f(i); 


} 
当 编 译 user. cpp 时 ,编译 器 会 执行 包含 操作 , 然后 编译 得 到 的 如 下 程序 : 


int f(int); 
int g(int 站 
{ 
return f(1); 


} 
由 于 ##include 的 处 理 逻 辑 上 在 编译 器 的 任何 其 他 动作 之 前 进行 , 因此 称 为 预 处 理 (preprocessing) 
(参见 A.17 节 ) 。 

为 了 方便 一 致 性 检查 , 我 们 在 使 用 声明 的 源 文件 和 给 出 定义 的 源 文 件 中 都 包含 头 文件 。 这 样 ， 
编译 器 就 能 尽 可 能 快 地 捕获 错误 。 例 如 , 假定 实现 Token_stream :: putback( ) 的 程序 员 犯 了 如 下 错误 : 


Token Token_stream: :putback(Token t) 
{ 

buffer.push_back(t); 

return t; 


} 

这 段 代码 看 起 来 没有 问题 (虽然 它 存 在 错误 ) , 幸运 的 是 , 编译 器 可 以 发 现 这 个 错误 , 因为 它 看 到 
了 (包含 进来 的 ) Token_stream :: putback( ) 的 声明 。 将 之 与 这 里 的 定义 比较 后 , 编译 器 发 现 putback 
( ) 不 应 该 返回 一 个 Token, 另外 buffer 是 一 个 Token 而 不 是 一 个 vector < Token > , 因此 我 们 不 能 在 
其 上 使 用 push_back( ) 。 这 个 错误 产生 的 原因 是 , 我 们 在 原 有 的 代码 上 继续 工作 , 试图 改进 它 , 但 
进行 的 修改 没有 保证 整个 程序 的 一 致 性 。 

类 似 地 , 考虑 下 面 代码 中 的 错误 : 

Tokent=ts.gett();  //error: no member gett 

/i... 

ts.putback(); / error: argument missing 
编译 器 会 立即 报告 错误 ,因为 头 文件 token. h 给 出 了 一 致 性 检查 所 需 的 所 有 信息 。 

头 文件 std-lib-facilities. h 包含 了 我 们 所 使 用 的 标准 库 中 的 功能 的 声明 ， 如 cout、vector 和 
sqrt( ) ， 以 及 一 些 不 在 标准 库 中 的 简单 工具 函数 的 声明 ,如 error( ) 。 在 12. 8 节 中 我 们 会 说 明 如 何 
直接 使 用 标准 库 头 文件 。 

一 个 头 文件 通常 会 被 包含 在 很 多 个 源 文件 中 , 这 意味 着 头 文件 只 能 包含 那些 可 以 在 多 个 文件 
中 重复 多 次 的 声明 (如 函数 声明 、 类 定义 和 数值 常量 的 定义 ) 。 


8.4 作用 域 


作用 域 (scope) 是 一 个 程序 文本 区 域 。 每 个 名 字 都 定义 在 一 个 作用 域 中 , 在 声明 点 到 作用 域 


结束 的 区 间 内 有 效 。 例 如 : 
void f() 
{ 
gO; // error: g() isn't (yet) in scope 
} 


void g() 


f0; I/ OK: f() is in scope 
} 


void h() 

{ 
int x = y; // error: yisn't (yet) in scope 
int y = X; / OK: x is in scope 
BO0; // OK: g0 is in scope 


名 字 在 其 声明 的 定义 域 租 套 的 定义 域 中 也 有 效 。 例 如 ,上 面 代码 中 对 f( ) 的 调用 在 g( ) 的 作用 域 
中 ,此 作用 域 嵌 套 于 全 局 作用 域 , 全 局 作用 域 不 在 任何 其 他 作用 域内 。 名 字 必 须 先 声明 后 使 用 的 
规则 这 里 还 是 适用 的 , 因此 f( ) 不 能 调用 g( )。 

C++ 支持 多 种 类 型 的 作用 域 ， 帮 助 我 们 控制 变量 在 哪里 可 用 : 

。 全 局 作用 域 : 在 任何 其 他 作用 域 之 外 的 程序 区 域 。 

e 名 字 空 间作 用 域 : 一 个 名 字 空 间作 用 域 柑 套 于 全 局 作用 域 或 男 一 个 名 字 空 间作 用 域 中 , 参 

见 8.7 市 。 

。 类 作用 域 : 一 个 类 内 的 程序 区 域 , 参见 9.2 节 。 

。 局 部 作用 域 : 位 于 { ... | 大 括号 之 间或 函数 参数 列表 中 的 程序 区 域 。 

e。 语句 作用 域 : 例如 , for 语句 内 的 程序 区 域 。 
作用 域 的 主要 作用 是 保持 名 字 的 局 部 性 , 使 之 不 影响 声明 于 其 他 地 方 的 名 字 。 例 如 : 

void f(int x) /fis global; x is local tof 

{ 


intz=x+7; //zis local 


} 


int g(int x) // gis global; x is local to g 
{ 

intf =x+2; //fis local 

return 2*f; 


} 
下 图 描述 了 上 面 代码 中 的 作用 域 信息 。 这 里 , f( ) 中 的 x 与 8() 中 的 x 是 不 全局 作用 域 ， 
一 样 的 。 它 们 不 会 冲突 ,因为 不 在 同一 个 作用 域 中 : f( ) 中 的 x 在 f 的 局 部 i 
作用 域 中 , 而 g( ) 中 的 x 在 g 的 局 部 作用 域 中 。 位 于 同一 个 作用 域 中 , 不 
能 共存 的 两 个 声明 称 为 冲突 (clash) 。 类 似 地 ，g( ) 中 定义 的 (显然 ) 不 是 
全 局 函数 f( ) 。 

下 面 代码 中 局 部 作用 域 的 使 用 与 上 例 类 似 , 但 这 段 代码 更 接近 实际 的 
例子 : 
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int max(int a, int b) // max is global; a and b are local 
return (a>=b)? a : b; 

} 

int abs(int a) // not max()’s a 

2 return (a<0) ? -a : a; 

} 


在 标准 库 中 你 会 发 现 max( ) 和 abs( ) ， 因 此 你 不 必 自 己 编写 这 两 个 函数 。? ;结构 称 做 算术 if(arith- 
metic 这) 或 条 件 表 达 式 (conditional expression) 。 当 a>=b 时 , (a>=b)? a:b 的 值 为 a, 否则 为 b。 
条 件 表达 式 可 以 帮助 我 们 避免 下 面 这 种 元 长 的 代码 ; 


int max(int a, int b) // max is global; a and b are local 
{ 
int m; lm is local 
if (a>=b) 
m=a; 
else 
m=b; 
return m; 
} 


因此 , 除了 很 明显 的 全 局 作用 域外 ,其 他 作用 域 都 使 名 字 保 持 局 部 性 。 在 很 多 场合 , 局 部 性 是 一 
种 很 好 的 性 质 , 因此 你 应 该 尽量 保持 名 字 的 局 部 性 。 当 你 在 函数 、 类 和 名 字 空 间 内 部 声明 变量 和 
蚂 数 时 ,它们 不 会 影响 你 的 变量 和 函数 。 记 住 , 实际 程序 中 有 成 千 上 万 的 命名 实体 , 为 了 使 这 种 
程序 易于 管理 , 多 数 名 字 都 应 该 是 局 部 性 的 。 

下 面 是 一 个 较 大 的 实例 , 说 明了 名 字 是 如 何在 语句 和 语句 块 (包括 函数 体 ) 末 尾 离开 作用 域 的 : 


Anoriorvhere 
class My_vector { 


vector<int> v; lv is in class scope 
pubiic: 
int largest() 
{《 
intr = 0; Aris local (smallest nonnegative int) 


for (int i = 0; i<v.size(); ++i) 
r=max(r,abs(v[il)); /iis in the for’s statement scope 
/no i here 
return r; 
} 
/ no r here 
}»; 


// no v here 


int x; // global variable 一 avoid those where you can 
int y; 


int f() 
{ 
int x; // local variabje 
xX=7; // the jocal x 
{ 
int x = y; // local x initialized by global y 
++X; // the x from the previous line 


++X; /the x from the first line of 从 
return x; 
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只 要 可 能 , 你 应 该 避免 这 种 复杂 的 嵌 套 和 隐藏。 记 住 :“ 保 持 简单 性 1” 

一 个 名 字 的 作用 域 越 大 , 名字 就 应 该 越 长 、 越 有 描述 性 : 将 全 局 变量 命名 为 x、y 和 上 是 灾难 
性 的 。 你 在 程序 中 应 尽量 少 用 全 局 变量 ,一 个 主要 原因 是 你 很 难 知道 哪个 函数 会 修改 它们 。 在 大 
的 程序 中 , 基本 不 可 能 知道 哪个 函数 修改 了 一 个 全 局 变量 。 想 象 你 正在 调试 一 个 程序 ,而 你 发 现 
一 个 全 局 变量 的 值 与 预期 不 符 。 那 么 是 谁 赋予 它 这 个 值 ? 为 什么 这 样 赋值 ? 是 哪个 函数 干 的 ? 你 
如 何 能 知道 这 些 信息 ? 赋予 此 变量 这 个 错误 值 的 函数 可 能 在 你 从 未 见 过 的 一 个 源 文件 中 ! 如 果 
非 有 不 可 的 话 , 一 个 好 的 程序 也 应 该 只 有 非常 少 (如 一 个 或 两 个 ) 的 全 局 变量 。 例 如 , 我 们 在 第 6 
章 和 第 7 章 给 出 的 计算 器 程序 只 有 两 个 全 局 变量 : 单词 流 ts 和 符号 表 names。 

注意 , 多数 C++ 语法 结构 定义 了 嵌入 的 作用 域 ; 

。 类 中 的 函数 : 成 员 苑 数 (参见 9.4.2 节 ) 


class C1 
public: 
void f{(); 
void g80  //a member function can be defined within its class 


/a 


void C::f(} //a member definition can be outside its class 
{ 

i... 
) 
这 是 一 种 最 常见 和 最 有 用 的 情况 。 
e 类 中 的 类 : 成 员 类 (也 称 做 明和 人 类 ) 
class Ct 
public: 

struct M1 

i... 

}; 

di ws 
}; 
这 只 在 复杂 类 中 才 有 用 , 记 住 理想 情况 是 保持 类 简短 、 简 单 。 
e 困 数 中 的 类 : 局 部 类 


void f() 
{ 
classLt{ 
/a 
六 
人 fa 
} 


应 避免 这 种 代码 ,如果 你 觉得 需要 一 个 局 部 类 , 那么 你 的 函数 可 能 太 长 了 。 
。 盟 数 中 的 函数 : 局 部 函数 (也 称 做 能 套 函 数 ) 


void f() 

{ 
void g() /illegal 
{ 


We 
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这 在 C++ 中 是 不 合法 的 , 不 要 写 这 种 代码 , 编辑 器 会 拒绝 它 。 
。 轩 数 或 块 中 的 块 : 能 套 块 
void flint x, int y) 


{ 
if (>y) { 
| 


} 


else { 


} 

} 

骨 套 块 是 避免 不 了 的 , 但 要 对 复杂 的 嵌 套 保持 警惕: 它 很 容易 隐藏 错误 。 
C++ 还 提供 了 一 种 语言 特性 : 名 字 空 间 , 专门 用 于 表达 作用 域 , 参见 8.7 节 。 

注意 , 我 们 使 用 一 致 的 缩 进 格式 来 表明 般 套 ,如 果 不 这 样 , 网 套 的 结构 就 会 很 难 读 。 例 如 : 

/dangerously ugly code 

Struct X { 

void f(int x) { 

struct Y { 

int f() { return 1; } int m; }; 

int m; 

m=Xx; Y m2; 

return if(m2.f()); } 

int m; void g(int m) { 

if (m) f(m+2); else { 

gl(m+2); }} 

XO) {} void m3() { 

} 


void main() { 
其 a; a.f(2);} 
}} 


难 读 的 代码 往往 隐藏 着 错误 。 当 你 使 用 某 种 IDE 时 , IDE 会 尽力 自动 地 (根据 某 种 “恰当 的 "规则 ) 
将 你 的 代码 整理 成 恰当 的 缩 进 格式 。 也 有 一 种 “代码 美化 器 ”, 可 以 重 整 源 代码 文件 的 格式 (通常 
可 以 允许 你 自己 选择 格式 ) 。 但 是 , 令 你 的 代码 可 读 的 最 终 的 责任 还 是 在 你 自己 。 
8.5 项 数 调用 和 返回 

函数 为 我 们 提供 了 表示 操作 和 计算 的 途径 。 当 我 们 要 完成 某 些 工作 ,而 这 些 工 作 值得 起 一 个 
名 字 , 我 们 就 可 以 编写 一 个 函数 。C++ 语言 为 我 们 提供 了 运算 符 ( 如 + 和 * ), 我 们 可 以 在 表达 式 
中 用 运算 符 从 运算 对 象 产 生出 新 值 。C ++ 还 提供 了 语句 (如 for 和 让) , 我 们 可 以 用 它们 控制 程序 
执行 的 顺序 。 为 了 组 织 由 这 些 原 语 构成 的 代码 , 我 们 需要 使 用 函数 。 

为 了 完成 自身 的 工作 ,函数 通常 需要 参数 , 很 多 函数 还 返回 一 个 结果 。 本 节 关 注 参 数 如 何 指 
定 和 传递 。 
8. 5.1 声明 参数 和 返回 类 型 

函数 是 C++ 中 我 们 用 来 命名 和 表示 计算 和 操作 的 语法 结构 。 一 个 函数 声明 由 一 个 返回 值 后 
跟 函 数 名 , 青 接 一 个 形式 参数 (formal argument, 简称 形 参 ) 列表 构成 。 例 如 : 
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double fct(int a, double d); / declaration of fct (no body) 
double fct(int a, double d) {returna*d; } // definition of fct 
一 个 函数 定义 包含 函数 体 ( 调 用 此 函数 时 应 执行 的 语句 ) , 而 一 个 非 定义 的 函数 声明 则 只 接 一 个 分 
号 。 形 参 (parameter) 通 常 也 称 为 参数 。 如 果 你 不 希望 一 个 函数 接受 参数 , 则 可 省 略 形 参 。 例 如 : 


int current_power(0); /H/ current_power doesn't take an argument 
如 果 你 不 希望 苯 数 返回 一 个 结果 , 可 将 其 返回 类 型 设置 为 void。 例如: 
void increase_power(int level); / increase_power doesn't return a value 


这 里 , void 的 意思 是 “不 返回 一 个 值 ” 或 “什么 也 不 返回 ”。 
在 函数 声明 和 年 义 中 , 你 可 以 为 参数 命名 也 可 以 不 命名 , 完全 取决 于 你 的 需要 。 例 如 : 


/1 search for s jn vs; 

/ vs[hint] might be a good place to start the search 

// return the index of a match; -1 indicates “not found” 

int my_find(vector<string> vs, string s, int hint);  //naming arguments 


int my_find(vector<string>, string, int); z // not naming arguments 


在 函数 声明 中 , 形 参 的 名 字 不 是 必需 的 , 只 是 对 于 编写 好 的 注释 很 有 益处 。 从 编译 器 的 角度 看 ， 
第 二 个 my_find( ) 声 明 与 第 一 个 一 样 好 : 它 包 含 所 有 调用 my_find( ) 所 需 的 信息 。 
通常 , 我 们 会 命名 函数 定义 中 的 所 有 参数 , 例如 : 


int my_find(vector<string> vs, string s, int hint) 
/ search for s in vs starting at hint 
{ 
if (hint<0 || vs.size(}<=hint) hint = 0; 
for (inti = hint; i<vs.size(); ++i)  //search starting from hint 
if (vs{i]==s) return i; 
if (Q<hint) { // if we didn'’t find s search before hint 
for (int i = 0; i<hint; ++i) 
it (vs{i]}==s) return i; 
} 
return 一 1; 


} 
参数 hint 使 代码 复杂 了 许多 , 但 它 的 使 用 是 基于 这 样 一 个 假设 : my_find( ) 的 使 用 者 粗略 知道 如 何 
在 一 个 向 量 中 找到 一 个 字符 串 , 所 以 使 用 hint 可 以 导致 好 的 效果 。 但 是 , 假设 我 们 已 经 使 用 了 
my_find( ) 一 段 时 间 ，, 发 现 调 用 者 很 少 能 用 好 hint, 因此 它 实际 上 降低 了 性 能 。 现 在 我 们 不 再 需要 
hint 了 , 但 是 已 有 大 量 “ 外 部 ”代码 调用 my_find( ) 时 使 用 了 参数 hint。 我 们 不 希望 重 写 这 些 代码 
(或 者 因为 是 他 人 所 写 代 码 无 法 修改 ) ,因此 我 们 不 想 更 改 my_find( ) 的 声明 。 兰 代 方 法 是 , 我 们 
不 再 使 用 最 后 一 个 参数 (但 在 声明 中 保留 它 ) 。 由 于 不 再 使 用 , 所 以 可 以 不 为 其 命名 : 


int my_find(vector<string> vs, string s, int) /3rd argument unused 


{ 
for (int ij = 0; iji<vs.size(); ++i) 
if (vs[ij==s) return i; 
return 一 1; 
} 


你 可 在 Stroustrup 的 《The C++ Programming Language》 一 书 中 和 ISO C++ 标 准 中 找到 变量 和 也 数 定 
义 的 完整 语法 。 
8. 5.2 返回 一 个 值 

我 们 可 以 用 return 语句 从 晒 数 返回 一 个 值 : 

T {tO 1 fO returns aT 

{ . 


Vv; 
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return v; 
} 
Tx=f0; 
这 段 代码 中 的 返回 值 恰 好 就 是 我 们 用 一 个 类 型 为 V 的 值 初始 化 一 个 类 型 为 了 的 变量 所 得 到 的 值 : 
Vy; 
/em 


T t(v); / initialize t with v 
也 就 是 说 , 返回 值 可 以 看 做 初始 化 的 另 一 种 形式 。 如 果 函 数 声 明 中 指定 要 返回 值 , 则 函数 体内 必 


须 通过 retum 返回 一 个 值 。 否 则 ， 就 会 导致 错误 “直至 函数 末尾 未 返回 值 ”: 
double my_abs(intx) /warning: buggy code 
{ 
if (x < 0) 
return —x; 
else if (x > 0) 
return x; 
} Werror: no value returned if x is 0 


实际 上 , 编译 器 可 能 不 会 注意 到 我 们 “忘记 了 ”x ==0 的 情形 。 原 则 上 它 应 该 注意 到 , 但 很 少 有 编译 
器 如 此 聪明 。 对 于 复杂 的 函数 , 编译 器 完全 可 能 无 法 知道 你 是 否 返 回 了 一 个 值 , 因此 编程 中 要 小 心 。 
这 里 ,“ 小 心 ” 的 意思 是 , 要 切实 保证 对 于 函数 的 每 种 执行 路 径 都 有 一 条 retum 语句 或 一 个 error( ) 。 
由 于 历史 原因 ,main( ) 是 一 个 特例 。 执 行 到 main( ) 的 末尾 而 未 返回 值 , 等 价 于 返回 0, 意思 
是 “成 功 完成 "程序 。 z 
在 一 个 不 返回 值 的 函数 中 , 我 们 可 以 调用 无 值 的 retum 语句 从 函数 返回 调用 者 。 例 如 : 


void print_until_s(const vector<string> v, const string quit) 


{ 
for(int i=0; i<v.size(); ++i) { 
if (v[il==quib return; 
cout << vl << \n'; 
} 
} 


如 你 所 见 , 在 一 个 void 函数 中 直至 末尾 未 返回 值 是 合法 的 , 这 等 价 于 一 个 无 值 的 返回 retum;。 
8. 5. 3 ” 传 值 参数 

向 函数 传递 参数 最 简单 的 方式 是 , 将 参数 的 值 找 贝 一 份 , 交 给 函数 。 一 个 函数 于 ) 的 参数 实 
际 上 是 f( ) 中 的 局 部 变量 , 每 次 长 ) 被 调用 时 都 会 初始 化 。 例 如 : 


/ pass-by-value (give the function a copy of the value passed) 


int f(int x) 
{ 
x = X+1， // give the local x a new value 
return x; 
} 
int main() 
{ 
int xx = 0; 
cout << f(xx) << endl; /HA write: 1 
cout << xx << endl; // write: 0; f() doesn't change xx 
intyy = 7; 
cout << f(yy) << endl; // write: 8 
cout << yy << endl; /1 write: 7; f() doesn't change yy 
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由 于 传递 的 是 拷贝 ,因此 f( ) 中 的 x=x+1 不 会 改变 两 次 调用 时 传递 的 变量 xx 和 yy 的 值 。 下 图 可 
以 说 明 传 值 参数 的 机 制 : 





传 值 方 式 非 常 直接 ,其 代价 就 是 拷贝 值 的 代价 。 
8. 5.4 传 常 量 引 用 参数 


当 传递 占用 存储 空间 小 的 值 ， 如 一 个 整数 、 一 个 双 精 度数 或 一 个 单词 (参见 6.3.2 节 ) 时 ， 
传 值 方式 简单 、 直 接 、 高 效 。 但 对 于 占用 存储 空间 大 的 值 ， 如 一 个 图 像 (通常 有 几 百 万 位 大 
小 ) 一 个 大 表 ( 比如 几 生 个 整数 ) 或 一 个 长 字符 串 (比如 几 百 个 字符 ) 时 , 又 如 何 呢 ?在 这 种 情 
况 下 , 拨 贝 的 代价 就 会 非常 高 。 我 们 不 必 为 拷贝 代价 所 困扰 , 但 做 不 必要 的 工作 就 可 能 会 很 麻 
烦 了 , 这 意味 着 我 们 不 能 直接 表达 想 要 什么 。 例 如 , 我 们 可 能 会 编号 下 面 这 个 函数 来 打印 一 个 
浮 点 数 问 量 : 
void print(vector<double>v)  //pass-by-value; appropriate? 
cout <<"{'";» 
for (int i = 0; j<v.size(); ++i) { 
cout << v[i]; 
if (ji1=v.size()-1) cout << ", "» 
} 


cout << " Mn'; 


} 
这 个 print( ) 函数 适用 于 所 有 规模 的 向 量 , 例如 : 


void f(int x) 

{ 
vector<double> vd1(10); // small vector 
vector<double> vd2(1000000);  // large vector 
vector<double> vd3(x); /ff vector of some unknown size 
1 .. .fill yd1, vd2, vd3 with values ... 
print(vd1); 
print(vd2); 
print(vd3); 

} 


这 段 代 码 可 以 得 到 我 们 想 要 的 结果 , 但 首次 调用 print( ) 需 要 拷贝 10 个 双 精 度数 (大 概 80 个 字 
节 ), 第 二 次 调用 需要 拷贝 100 万 个 双 精 度数 (大 概 8 兆 字 节 )，, 而 第 三 次 调用 需要 拷贝 多 少 字 
节 我 们 不 知道 。 在 此 , 我 们 必须 问 自 己 一 个 问题 ;“ 为 什么 我 们 要 拷贝 全 部 数据 ?” 我 们 只 不 过 
是 想 打印 向 量 , 而 不 是 拷贝 它们 的 元 素 。 显 然 , 必须 要 有 一 种 方法 , 能 使 我 们 向 函数 传递 一 个 
变量 , 而 不 拷贝 其 值 。 一 个 类 似 的 例子 是 , 如 果 你 被 分 派 了 一 个 任务 一 一 为 图 书馆 中 的 书籍 建 
一 个 目录 , 馆 长 不 会 给 你 送 去 图 书馆 大 楼 和 其 内 所 有 内 容 的 一 份 拷贝 , 而 只 是 把 图 书馆 的 地 址 
发 送 给 你 , 这 样 你 就 能 到 图 书馆 去 浏览 馆藏 书籍 。 因 此 , 我 们 需要 某 种 方法 , 能 将 要 打印 的 向 
量 的 “地 址 ”而 不 是 其 拷贝 传送 给 print( ) 函数 。 这 样 的 “地 址 ” 称 为 引用 (reference) ， 其 使 用 方 
法 如 下 : 
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void print(const vector<double>& v) / pass-by-const-reference 


{ 
cout << "{"; 
for (int i = 0; i<v.size(); ++i) { 
cout << v[i]; 
if (il=v,size()—1) cout << ", "; 
} 
cout <<" }\n"; 
} 


符号 && 表 示 “ 引用”, 而 此 处 的 const 用 来 阻止 print( ) 无 意 中 修改 其 参数 。 除 了 参数 声明 进行 了 修 
改 外 ,代码 所 有 其 他 部 分 者 与 传 值 方式 的 版 本 完全 一 样 ; 唯一 的 改变 在 于 print( ) 现 在 是 通过 引用 
“提取 到 ”参数 的 值 , 而 非 拷 贝 操作 。 注 意 短语 “提取 ”(refer back) ,这 种 参数 之 所 以 称 为 引用 , 是 
因为 它们 “指向 ”定义 于 别处 的 对 象 ( 它 们 并 不 是 对 象 本 映 )。 我 们 可 以 像 以 前 一 样 调用 新 版 本 的 


print( ) : 

void f(int x) 

{ 
vector<double> vd1(10); // small vector 
vector<double> vd2(1000000); /large vector 
vector<double> vd3(x); / vector of some unknown size 
1 .. .fill vd1, vd2, vd3 with values ... 
print(vd1); 
print(vd2); 
print(vd3); 

} 


传 常 量 引 用 方式 如 下 图 所 示 : 
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常量 (const) 引 用 的 一 个 非常 有 用 的 特性 是 , 我们 不 可 能 意外 地 修改 传 来 的 对 象 。 例 如 , .如 果 我 们 
犯 了 一 个 蚌 屋 的 错误 ,试图 在 print( ) 中 修改 向 量 元 素 , 编译 器 就 会 发 现 这 个 错误 : 


void print(const vector<double>& v) / pass-by-const-reference 


{ 
ll... 
v[j=7; /error: vy isa const (is not mutable) 
/ee 

} 


传 常量 引用 参数 是 一 种 有 用 的 、 常 用 的 机 制 。 请 再 次 考虑 my_find( ) 函数 (参见 8.5. 1 节 ), 它 在 
一 个 字符 串 癌 量 中 搜索 一 个 字符 串 , 传 值 参数 会 导致 不 必要 的 拷贝 代价 : 

int my_find(vector<string> vs, string s); / pass-by-value: copy 
如 有 果 向 量 中 包含 数 千 个 字符 串 ， 即 便 在 一 台 非 常 快 的 计算 机 上 , 你 也 能 观察 到 拷贝 所 花费 的 时 
间 。 因 此 , 我 们 可 以 通过 将 my_find( ) 的 参数 改 为 传 常量 引用 方式 来 改进 它 : 


/pass-by-const-reference: no copy, read-only access 
int my_find(const vector<string>& vs, const string& s); 
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8. 5.5 传 引 用 参数 


但 是 , 如 有 果 我 们 确实 希望 函数 修改 其 参数 ,又 该 怎么 办 呢 ? 有 时, 我 们 有 充足 的 理由 需要 这 
么 做 。 例 如 , 我 们 可 能 需要 一 个 init( ) 函数 为 向 量 元 素 赋值 : 


void init(vector<doubie>& v)  //pass-by-reference 
{ 


for (int i = 0; i<v.size(); ++i) v[i] = i; 


} 

void g(int x) 

{ 
vector<double;> vd1(10); // small vector 
vector<double> vd2(1000000);  // large vector 
vector<doubje> vd3(x); // vector of some unknown size 
init(vd1); 
init(vd2); 
init(vd3); 

} 


这 里 , 我 们 希望 init( ) 函数 修改 参数 向 量 , 因此 我 们 没有 使 用 传 值 参 数 ( 拷 贝 参数 值 ), 也 没有 使 
用 传 常量 引用 参数 (不 允许 修改 参数 ) ， 只 是 将 实际 参数 的 “简单 引用 ”传递 给 形 参 。 

让 我 们 从 更 技术 化 的 角度 来 探讨 一 下 引用 。 引 用 是 这 样 一 种 语法 机 制 , 它 允 许 用 户 为 一 个 对 
象 声 明 一 个 新 的 名 字 。 例 如 , int& 是 一 个 整 型 对 象 的 引用 , 因此 , 我 们 可 写 出 如 下 代码 : 

inti=7; 

int& r= i; /ris a reference to i 

r=9; /i becomes 9 

i= 10; 

cout<<r<<''<<i<<'n'; /write: 10 10 
也 就 是 说 , 任何 对 r 的 使 用 实际 上 使 用 的 是 i。 

引用 的 一 个 用 途 是 作为 简写 形式 。 例 如 , 我 们 可 能 用 到 如 下 二 维 向 量 : 

vector< vector<double> > v; // vector of vector of double 
我 们 需要 多 次 使 用 某 个 向 量 元 素 vLf(x) ] [g(x) ]。v[f(x) ][g(x) ] 是 一 个 复杂 的 表达 式 , 我 们 当 
然 不 愿意 反复 输入 它 。 如 果 我 们 只 是 需要 这 个 元 素 的 值 , 那么 可 以 声明 下 面 这 个 变量 . 

doubie val = v[f(x)][g(yY)]; // val is the value of v[f(x)]{g(y)] 
然后 多 次 使 用 val 即 可 。 但 如 有 果 我 们 既 要 从 v[f(x) ][ g(x) ] 中 读 取 值 , 又 要 向 它 写 入 值 呢 ?这 时 ， 
引用 就 派 上 用 场 了 : 

double& var = v[f(x)][g(y)]; / var is a reference to vtf(x)]jtg(y)] 
现在 , 通过 var, 我 们 既 可 以 从 v[f(x) ] [g(x)] 中 读 取 值 , 也 可 以 向 它 写 人 值 。 例如: 


var = var/2+sqrt(var); 


引用 的 这 一 重要 特性 , 即 可 以 方便 地 作为 某 个 对 象 的 简写 形式 的 特性 , 是 引用 能 作为 一 种 有 用 的 
参数 传递 方式 的 原因 。 例 如 : 


// pass-by-reference (let the function refer back to the variable passed) 





int f(int& x) 

{ a 
X= Xx+]1; 
return x; 
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int main() 
{ 
int xx = 0; 
cout << f(xx) << endl; i/ write: 1 
cout << xx << endl; // write: 1; 们 changed the value of xx 
int yy = 7; 
cout << flyy) << endl; I/ write: 8 
cout << yy << endl; /I/ write: 8; f() changed the value of yy 
} 
下 图 说 明了 上 例 中 传 引用 方式 参数 传递 的 原理 : 


X:、 第 一 次 调用 (Xx 指向 XX) 





请 将 此 例 与 8. 5.3 节 中 的 类 似 实 例 进 行 比较 。 
传 引 用 参数 显然 是 一 种 非常 强大 的 机 制 : 在 函数 中 我 们 可 以 直接 操作 任何 以 引用 方式 传递 来 
的 对 象 。 例 如 , 交换 两 个 值 是 很 多 算法 (例如 排序 ) 中 非常 重要 的 操作 。 利 用 引用 , 我 们 可 以 编写 


下 面 这 样 一 个 交换 两 个 浮 点 数 的 函数 : 
void swap(double& d1, double& d2) 


{ 
doubletemp= di; /copy dl1’s value to temp 
d1 = d2; I copy d2's value to dl 
d2 = temp; I copy d1’s old value to d2 
} 
int main() 
{ 
double x = 1; 
double y = 2; 
cout << "X == "<<X<<ny=="<<y<c<nn') /write: x==1 y==2 
swap(x,y); 
couf<<"x=="<<x<<"y=="<ey<e Mn; /write: x==2 y==1 
} 


标准 库 提供 了 一 个 swap( ) 函数 , 可 以 用 来 交换 任何 类 型 的 值 , 只 要 该 类 型 支持 拷贝 操作 即 可 。 因 
此 , 你 不 需要 为 每 个 类 型 编写 自己 的 swap( ) 函数 。 


8. 5.6 传 值 与 传 引用 的 对 比 
如 何在 传 值 方式 、 传 引用 方式 和 传 常量 引用 方式 间 进 行 选 择 呢 ? 我 们 先 来 看 第 一 个 例子 ; 


void flint a, int& r, const int& cr) 


{ 
++a; //change the locala 
++r; /change the object referred to byr 
十 +Cr /error: Cr is const 

} 


如 果 你 希望 改变 被 传递 的 对 象 的 值 ,你 应 该 使 用 非常 量 的 引用 : 传 值 方式 传 来 的 是 对 象 的 拷贝 
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而 传 常量 引用 方式 不 允许 你 修改 对 象 的 值 。 你 可 以 试 试 下 面 的 程序 , 观察 三 种 参数 传递 方式 


的 效果 : 
void g(int a, int& r, const int& cr) 
{ 
++a; // change the local a 
++r; // change the object referred to by r 
int x = cr; // read the object referred to by cr 
} 
int main() 
{ 
int x = 0; 
int y = 0; 
int z = 0; 
B(X,Y,2); 1 x==0; y==1; z==0 
g(1,2,3); // error: reference argument r needs a variable to refer to 
g(1,y,3); AH/ OK: since cr is const we can pass a literal 
} 


你 如 果 想 改变 通过 引用 方式 传递 过 来 的 对 象 的 值 , 你 必须 传递 一 个 对 象 , 而 不 能 是 一 个 常量 。 从 
技术 上 讲 , 整 型 文字 和 常量 2 只 是 一 个 值 ( 右 值 , rvalue) ， 而 不 是 一 个 能 保存 值 的 对 象 。 而 这 里 函数 
g( ) 的 参数 + 需要 的 是 一 个 左 值 (lvalue), 即 可 以 出 现在 赋值 号 左边 的 内 容 。 

注意 , 常量 引用 不 需要 一 个 左 值 , 它 可 以 像 初 始 化 和 传 值 方式 一 样 进行 转换 。 在 上 面 的 代码 
中 ， 当 进行 最 后 一 次 调用 g(1, y, 3) 时 发 生 了 什么 呢 ? 情况 是 这 样 的 ,编译 器 为 函数 g( ) 的 参数 
cr 分 配 了 一 个 整 型 变量 , 令 cr 指 回 它 : 

Blly,3); /means: int _compiler_generated = 3; g(1,y,__compiler_generated) 
这 种 编译 器 生成 的 对 和 象 称 为 临时 对 象 (temporary objeet) 。 

我 们 的 根本 原则 是 : 

1 ) 使 用 传 值 方式 传递 非常 小 的 对 象 。 

2) 使 用 传 常量 引用 方式 传递 你 不 需要 修改 的 大 对 象 。 

3) 让 函数 返回 一 个 值 ， 而 不 是 修改 通过 引用 参数 传递 来 的 对 象 。 

4) 只 有 迫不得已 时 才 使 用 传 引用 方式 。 
这 些 原则 会 帮 有 我 们 写 出 最 简单 、 最 不 易 出 错 而 且 最 高 效 的 代码 。“ 非 常 小 "的 意思 是 一 个 或 两 个 整 
型 数 、 一 个 或 两 个 双 精 度数 或 和 它们 差不多 大 小 的 对 象 。 如 果 我 们 发 现 一 个 参数 是 以 非常 量 引用 
方式 传递 的 , 我 们 必须 假设 被 调用 的 消 数 会 修改 这 个 参数 。 

第 三 条 规则 表达 的 是 ， 当 你 想 用 函数 中 改变 一 个 变量 的 值 时 ,实际 上 你 还 有 另 一 种 选择 。 考 


虑 如 下 代码 : 
int incri(int a) { return a+1; } // return the new value as the result 
void incr2(int& a) { ++a; } // modify object passed as reference 
int x = 7; 
x = incrl(x); I/ pretty obvious 
incr2(x); // pretty obscure 


那么 我 们 为 什么 还 需要 非常 量 引用 传递 方式 呢 ? 因为 有 时 候 这 种 参数 传递 方式 是 必要 的 
。 用 于 操作 容器 ( 比 向 量 ) 
e 用 于 改变 多 个 对 象 的 函数 ( 函数 只 能 有 一 个 返回 值 ) 

例如 : 
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void larger(vector<int>& v1, vector<int>& v2) 
// make each element in v1 the larger of the corresponding 
// elements in v1 and v2; 
// similarly, make each element of v2 the smaller 
{ 
if (v1.size()i=v2.size() error("larger(): different sizes"); 
for (int i=0; ji<v1.size(); ++i) 
if (v1[i]<v2[i]) 
swap(v1[i],v2Ii]); 
} 


void f() 
{ 
vector<int> vx; 
vector<int> vy; 
// read vx and vy from input 
larger(vx,vy); 
1... 
} 
对 于 larger( ) 这 样 的 函数 来 说 , 使 用 传 引用 参数 是 唯一 合理 的 选择 。 
通常 最 好 避免 让 函数 修改 多 个 对 象 。 理 论 上 , 总 会 有 替代 方法 ， 比 如 返回 一 个 包含 多 个 值 的 
类 对 象 。 但 是 , 已 经 有 大 量程 序 使 用 了 修改 一 个 或 多 个 参数 的 函数 ,因此 你 很 可 能 遇 到 这 类 程 
序 。 例 如 , 在 Fortran( 大 约 50 年 中 一 直 是 用 于 数值 计算 的 主要 编程 语言 ) 中 , 所 有 参数 都 是 以 引 
用 方式 传递 的 。 很 多 数值 计算 程序 直接 借鉴 了 已 有 的 Fortran 程序 , 调用 了 Fortran 函数 。 这 些 代 
码 通 常 使 用 传 引用 方式 和 传 常量 引用 方式 。 
如 果 我 们 使 用 引用 只 是 想 避 免 拷贝 操作 , 那 可 以 使 用 常量 引用 。 这 样 ， 当 我 们 看 到 一 个 非常 
量 引用 参数 时 , 我 们 就 可 以 假定 这 个 浮 数 改 变 了 参数 的 值 ; 也 就 是 说 ， 当 我 们 看 到 一 个 非常 量 引 
用 的 参数 传递 时 , 我 们 假定 这 个 函数 不 仅 是 可 以 修改 参数 的 值 ， 而 是 确实 这 么 做 了 , 因此 我 们 必 
须 小 心 检 查 对 函数 的 调用 , 确保 它 按 我 们 所 期 待 的 那样 工作 。 
8. 5.7 参数 检查 和 转换 
参数 传递 过 程 就 是 用 函数 调用 中 指定 的 实际 参数 初始 化 函数 的 形式 参数 的 过 程 , 考虑 如 


下 代码 : 
void f(T x); 
f(y); 
T x=y; // initialize x with y (see §8.2.2) 


只 要 初始 化 语句 x=y; 合 法 ,函数 调用 f(x) 就 是 合法 的 ， 此 时 , 两 个 x( 初 始 化 的 变量 和 函数 的 
参数 ) 会 获得 相同 的 值 。 例 如 

void f(double); 

void g(int y) 

{ 


f(y); 
double x(y); 
} 


注意 , 用 y 初始 化 x 时 , 我 们 必须 将 一 个 整数 转换 为 一 个 双 精 度数 。 在 调用 函数 f( ) 时 , 会 进行 同 
样 的 操作 。f( ) 收 到 的 双 精 度 值 与 变量 x 中 保存 的 值 是 一 样 的 。 

类 型 转换 在 一 般 情况 下 是 很 和 用 的 , 但 偶尔 会 带 来 奇怪 的 结果 (参见 3.9.2 节 ) 。 因 此 ， 我 们 
对 类 型 转换 必须 小 心 。 例 如 ,如 果 一 个 函数 要 求 一 个 整数 , 那么 向 它 传递 一 个 双 精 度 参 数 就 不 是 
一 个 好 主意 : 
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void ff(int); 
void gg(double x) 
{ 
ff(x); //how would you know if this makes sense? 
} , , 
如 果 你 确实 是 想 将 一 个 双 精 度 值 截取 为 一 个 整数 , 请 使 用 显 式 类 型 转换 : 
void ggg(double x) 
{ 
intx1l =x; /truncate x 
int x2 = int(x); 
ff(x1); 
ff(x2); 
ff(x); // truncate x 
ff(intOO)); 
} 


使 用 显 式 类 型 转换 的 代码 , 其 他 程序 员 容 易 从 中 看 出 你 的 思路 。 
8.5.8 实现 函数 调用 

当 一 个 函数 被 调用 时 ， 计 算 机 实际 上 做 了 什么 呢 ? 第 6 章 和 第 7 章 中 的 函数 expression ( ) 、 
term( ) 和 primary( ) 可 以 很 好 地 说 明 这 一 问题 ,除了 一 个 细节 : 这 些 函 数 都 不 接受 参数 ,因此 我 们 
无 法 用 它们 解释 参数 是 如 何 传递 的 。 但 是 , 请 等 一 下 ! 这 些 函 数 必 然 是 获取 一 些 输入 的 ,否则 它 
们 不 可 能 做 任何 有 用 的 事情 。 实 际 上 它们 接受 了 一 个 隐 含 的 参数 : 它们 使 用 了 一 个 称 为 ts 的 To- 
ken_stream 对 象 来 获得 输入 , 而 ts 是 一 个 全 局 变量 。 我 们 可 以 改进 这 些 函 数 , 让 它们 接受 一 个 To- 
ken_stream& 类 型 的 参数 。 因 此 本 节 中 这 几 个 函数 都 被 增加 了 一 个 Token_streamg& 参数 ,而 所 有 与 
函数 调用 实现 不 相关 的 内 容 都 被 去 掉 了 。 

首先 ,函数 expression( ) 非常 简单 ， 它 有 一 个 参数 (ts) 和 两 个 局 部 变量 (left 和 t) : 


double expression(Token_stream& ts) 


{ 
double left = term(ts); 
Token t= ts.get0; 
1 
} 
其 次 ,函数 term( ) 与 expression( ) 非常 类 似 , 只 是 多 了 一 个 额外 的 局 部 变量 (d) , 用 来 保存 除 
法 运算 的 除数 。 
double term(Token_stream& ts) 
{ 
double left = primary(ts); 
Token t = ts.get(); 
ee 
case /': 
{ 
double d = primary(ts); 
Ws 
} 
h... 
} 


第 三 ,函数 primary( ) 与 term( ) 很 类 似 , 只 是 多 了 一 个 局 部 变量 left: 
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这 
oo 
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double primary(Token_streamé& ts) 
{ 
Tokent=ts.get (); 
switch (t.kind) { 
Case '(: 
{ double d = expression(ts); 
人 


} 
1 ... 


} 
} 


现在 这 些 函 数 已 经 不 再 使 用 任何 “和 鬼 鬼 和 尝 香 的 全 局 变量 ”了 , 用 来 说 明 函 数 调 用 机 制 已 经 非 
常理 想 了 : 它们 都 有 一 个 参数 , 都 有 局 部 变量 ， 而 且 它们 相互 调用 。 你 可 能 希望 有 机 会 重新 
回顾 一 下 完整 的 expression( ) 、term( ) 和 primary( ) 是 什么 样 ， 但 与 函数 调用 相关 的 特性 这 里 
都 已 经 给 出 了 。 

当 一 个 函数 被 调用 时 , 编译 器 分 配 一 个 数据 结构 , 保存 所 有 参数 和 局 部 变量 的 拷贝 。 例 如 ， 
当 expression( ) 第 一 次 被 调用 时 , 编译 器 会 创建 如 下 数据 结构 : 









调用 expression(): 


在 “编译 器 填充 "部分, 不 同 编译 器 填 人 的 内 容 不 同 , 但 基本 上 是 函数 返回 到 调用 者 以 及 返回 一 个 
值 给 调用 者 所 需 的 信息 。 这 样 的 数据 结构 称 为 函数 活动 记录 , 每 个 函数 的 活动 记录 都 有 自己 特有 
的 详细 布局 。 注 意 , 从 编译 器 的 角度 看 ,一 个 参数 只 是 另 一 个 局 部 变量 而 已 。 

到 目前 为 止 , 一 切 都 很 好 , 现在 expression( ) 调用 term( ) ,编译 器 会 为 term( ) 的 这 次 调用 创建 
相应 的 活动 记录 : 





幸 用 term(): 让 栈 增长 的 方向 


我 们 注意 到 term( ) 需 要 保存 有 一 个 额外 的 变量 d, 因此 在 调用 中 编译 器 为 它 分 配 了 存储 空间 ， 即 
使 程序 中 可 能 永远 也 不 使 用 它 。 这 没有 问题 , 对 于 合理 的 函数 (比如 本 书 中 我 们 直接 或 间接 使 用 
的 所 有 隔 数 ) 来 说 , 创建 一 个 函数 活动 记录 的 运行 时 代价 不 依赖 于 它 有 多 大 。 局 部 变量 d 只 有 当 
我 们 执行 case '/' 时 才 会 被 初始 化 。 

现在 term( ) 调 用 primary( ) , 编译 器 会 创建 如 下 活动 记录 : 
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调用 expression(): 


调用 term(): 


栈 增长 的 方向 


调用 primary(): 





这 人 么 叙述 下 去 看 来 有 些 鹃 叶 了 , 但 现在 primary( ) 调 用 expression( ) : 


调用 expression(): 





调用 term(): 羡 


栈 增长 的 方向 


编译 器 为 expression( ) 的 这 次 调用 创建 了 它 自己 的 活动 记录 , 与 第 一 次 expression( ) 调用 的 活 
动 记 录 是 不 同 的 。 这 样 left 和 t 在 两 次 调用 中 是 不 同 的 , 这 是 一 种 很 好 的 人 处理 方 式 , 否则 我 
们 将 处 于 糟糕 的 境地 。 一 个 函数 如 果 直 接 或 间接 (在 本 例 中 ) 调 用 自身 的 话 , 我 们 称 之 为 递 
归 (recursive)。 如 你 所 见 , 正 是 因为 有 了 上 述 函 数 调 用 和 返回 的 实现 技术 , 递归 函数 才 得 以 
成 立 ( 反 之 亦 然 ) 。 

因此 , 每 当 我 们 调用 函数 时 ， 活 动 记 录 栈 (stack of activation record ) 一 一 通常 就 称 0 为 栈 
(stack) 生 长 出 一 个 记录 。 反 过 来 ， 当 函数 返回 时 , 其 记录 就 不 再 有 用 。 例 如 ， 当 最 后 一 个 expres- 
sion( ) 调 用 返回 primary( ) 时 , 栈 将 复原 为 下 图 : 
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栈 增长 的 方向 
调用 primary(): 四 ek 
当 primary( ) 返 回 term( ) 时 , 栈 回 到 如 下 图 所 示 : 
调用 expression(): 
调用 term0): | 多 栈 增长 的 方向 





依 此 类 推 。 这 里 使 用 的 栈 , 也 称 为 调用 栈 (call stack ) ， 是 一 种 只 在 一 端 增长 和 缩减 的 数据 结构 ， 
其 增长 和 缩减 的 规则 是 : 后 进 先 出 。 

请 记 住 不 同 C++ 编译 器 实现 和 使 用 调用 栈 的 细节 是 不 同 的 , 但 基本 的 原理 就 大 致 如 上 文 所 
述 。 为 了 使 用 函数 , 你 需要 知道 函数 调用 是 如 何 实现 的 吗 ? 当然 不 需要 , 你 在 前 面 学 习 的 使 用 画 
数 的 知识 已 经 足够 多 、 足 够 好 了 ，, 学 习 本 小 节 关 于 函数 调用 实现 方面 的 内 容 不 是 必需 的 , 但 很 多 
程序 员 还 是 想 知道 这 方面 的 知识 , 而 且 很 多 程序 员 使 用 诸如 “活动 记录 ”、“ 调 用 栈 " 之 类 的 术语 ， 
所 以 了 解 一 下 这 方面 的 内 容 还 是 有 好 处 的 。 


8.6 求 值 顺 序 


一 个 程序 的 求 值 , 或 称 为 程序 的 执行 , 就 是 按照 语言 的 规则 逐条 运行 程序 中 的 语句 。 当 这 条 
“执行 线索 ”到 达 一 个 变量 定义 时 , 变量 就 会 被 创建 ; 也 就 是 说 , 编译 器 会 为 它 分 配 内 存 空间 , 并 
对 其 进行 初始 化 。 当 变量 退出 其 作用 域 时 , 将 会 被 销毁 , 即 原则 上 它 所 指向 的 对 象 会 被 删除 ， 编 
译 器 可 把 它 原来 占用 的 内 存 用 做 他 用 。 例 如 : 

string program_name = "silly"; 

vector<string> V; li v is global 


void f() 
‘ 
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String s; /sis local tof 
while (cin>>s && s!="quit") { 
string stripped; 1 stripped is local to the loop 
string not_letters; 
for (int i=0; i<s.size(); ++i) /i has statement scope 
if (isalphals[i])) 
stripped += s[i]; 
else 
not_ letters += s[i]; 
v.push_back(stripped); 
Ms 
} 
/ey 
} 


像 program_name 和 v 这 样 的 全 局 变量 , 在 main( ) 的 第 一 条 语句 执行 之 前 就 会 被 初始 化 。 其 生存 
期 直至 程序 结束 ， 随 后 会 被 销毁 。 它 们 创建 的 顺序 与 定义 的 顺序 相符 ( program_name 先 于 v 创 
建 ) ， 而 销毁 则 按 相 反 的 次 序 ( 即 v 先 于 program_name 被 销毁 ) 。 

当 有 代码 调用 f( ) 时 , 首先 会 创建 s, 并 将 其 初始 化 为 空 字符 串 ,s 的 生命 期 会 持续 到 从 f( ) 返 
回 的 时 刻 。 

每 次 进入 while 循环 的 循环 体 时 ,stripped 和 not_letters 两 个 变量 会 被 创建 。 由 于 stripped 的 定义 在 
not_jetters 之 前 , 因此 它 也 先 被 创建 。 两 个 变量 的 生存 期 都 是 到 本 次 循环 步 的 结束 为 止 , 在 循环 条 件 重 
新 求 值 之 前 被 销 筑 , 销毁 顺序 与 创建 顺序 相反 ( 即 not_letters 先 于 stripped 被 销毁 ) 。 因 此 ,如 果 我 们 在 
遇 到 字符 串 “quit" 之 前 读 和 人 10 个 其 他 的 字符 串 ，stripped 和 not_letters 将 会 被 创建 和 销毁 10 次 。 

每 次 到 达 for 循环 时 , i 会 被 创建 。 每 次 退出 for 循环 时 ,到达 语句 v push_back( stripped); 前 ， 
i 会 锌 铺 上 毁 。 

请 注意 , 编译 器 是 聪明 的 家 伙 , 它们 获准 优化 代码 ， 只 要 得 到 的 结果 与 我 们 的 目标 相符 即 可 。 
特别 是 ,编译 器 在 分 配 /释放 内 存 方 面 很 聪明 , 不 会 不 必要 地 频繁 分 配 / 释 放 内 存 。 

8. 6. 1 表达 式 求 值 

表达 式 中 子 表 达 式 求 值 顺 序 所 遵循 的 规则 , 是 按 优化 编译 器 的 需求 设计 的 ， 而 不 是 为 了 方便 
程序 员 。 这 很 不 幸 , 但 不 管 怎样 你 应 该 避免 复杂 的 表达 式 ， 有 一 条 简单 的 原则 可 以 帮 你 远离 麻 
烦 : 如 果 你 在 表达 式 中 改变 一 个 变量 的 值 , 不 要 在 同一 个 表达 式 中 再 读 或 写 这 个 变量 。 例 如 : 


VIi] = 十 Hi; jdon'it: undefined order of evaiuation 
Vv[++i] = i; /don undefined order of evaluation 
int x = ++i + ++i; /don undefined order of evaluation 
cout <<++i<<''<<i<<\n'; /don't: undefined order of evaluation 
f(4+i,++i); 1/ don't: undefined order of evaluation 


不 幸 的 是 , 如 果 你 写 出 这 样 有 问题 的 代码 , 并 不 是 所 有 编译 器 都 能 给 出 警告 。 这 有 段 代码 的 问题 在 
于 , 如 果 你 将 代码 迁移 到 另外 一 台 计 算 机 , 使 用 另 一 个 编译 器 , 或 者 改变 编译 器 优化 设置 , 运行 
结果 不 保证 一 致 。 不 同 的 编译 器 确实 会 对 这 段 代码 得 到 不 同 的 结果 , 所 以 不 要 这 么 编写 程序 。 
特别 要 注意 的 是 ，= (赋值 符 ) 在 表达 式 中 只 是 又 一 种 运算 符 而 已 , 并 没有 特殊 的 地 位 ， 因 此 
不 能 保证 赋值 符 左 边 的 子 表达 式 在 右边 的 子 表 达 式 之 前 求 值 。 这 就 是 为 什么 v[ ++i] =i 的 结果 
是 不 确定 的 。 
8. 6.2 全 局 初始 化 
在 间 一 个 编译 单元 中 的 全 局 变量 (以 及 名 字 空 间 变量 , 参见 8.7 节 ) 按 它们 出 现 的 顺序 被 初始 
化 。 例 如 : 
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/file 人 .cpp 
int x1 = 1; 
int y1 = x1+2; /yi becomes 3 


逻辑 上 , 这 几 个 变量 的 初始 化 在 main( ) 中 的 代码 执行 前 发 生 。 
除非 是 在 一 些 非常 特殊 的 情况 下 , 否则 一 般 来 说 使 用 全 局 变量 不 是 一 个 好 主意 。 我 们 已 经 提 
到 过 , 程序 员 没 有 有 效 的 方法 获知 程序 的 哪个 部 分 读 / 写 了 一 个 全 局 变量 (参见 8.4 节 )。 男 一 


问题 是 , 在 不 同 编译 单元 中 的 全 局 变量 的 初始 化 顺序 是 不 确定 的 。 例 如 : 
/file f2.cpp 
extern int Y1; 
int y2 = y1+2; /ly2 becomes 2 or5 


这 段 代码 存在 这 样 几 个 问题 ; 使 用 了 全 局 变量 ; 为 全 局 变量 起 了 很 短 的 名 字 ; 对 全 局 变量 使 用 了 
复杂 的 初始 化 。 如 果 文 件 入 . cpp 中 的 全 局 变量 先 于 文件 亿 . cpp 中 的 全 局 变量 被 初始 化 , 那么 到 
的 初 值 为 5( 这 可 能 是 程序 员 本 来 所 期 望 的 , 也 是 合理 的 )。 但 是 , 如 果 文 件 亿 . cpp 中 的 全 局 变量 
先 于 文件 纪 . cpp 中 的 全 局 变量 被 初始 化 , y2 的 初 值 将 为 2( 因为 分 配给 全 局 变量 的 内 存 空间 , 在 
变量 的 复杂 初始 化 前 被 置 为 0) 。 请 避免 使 用 这 种 代码 , 并 且 对 复杂 的 初始 化 保持 足够 的 警惕 , 任 
何不 是 简单 常量 表达 式 的 初始 化 都 可 以 认为 是 复杂 的 。 

但 如 果 确 实 需要 一 个 全 局 变量 (或 常量 ) ， 而 且 需 要 对 它 进 行 复杂 的 初始 化 , 你 又 该 怎么 做 
呢 ? 一 个 看 起 来 有 道理 的 例子 是 , 一 个 用 于 商务 事务 的 库 需 要 一 个 Date 类 型 的 对 象 , 我 们 想 初始 
化 这 个 对 象 : 

const Date default_date(1970,1,1); // the default date is January 1, 1970 
如 何 知 道 defaul_date 在 初始 化 之 前 从 未 使 用 过 呢 ? 原则 上 我 们 不 可 能 知道 ,因此 我 们 不 应 该 写 出 
这 样 的 代码 。 一 种 常用 的 技术 是 编写 一 个 函数 , 返回 我 们 需要 的 值 。 例 如 : 


const Date default_date() // return the default Date 


{ 
return Date(1970,1,1); 


每 当 我 们 调用 default_date( ) 函数 , 它 都 会 为 我 们 创建 一 个 Date 对 象 。 一 般 情况 下 , 这 种 技术 已 经 
足够 好 , 但 如 果 需 要 频繁 调用 default_date( ) ， 而 且 构 造 Date 对 象 代 价 较 高 的 话 , 我 们 更 倾向 于 只 
构造 它 一 次 。 可 以 这 样 做 : 
const Date& default_date() 
{ 
static const Date dd(1970,1,1); // initialize dd first time we get here 
return dd; 


} 
一 个 静态 的 局 部 变量 只 在 函数 首次 调用 时 才 被 初始 化 (被 创建 ) 。 注 意 , 这 里 返回 一 个 引用 , 因此 
消除 了 不 必要 的 对 象 拷贝 。 特 别 地 , 我 们 返回 了 一 个 常量 引用 , 可 以 防止 调用 者 无 意 中 改变 对 象 
的 值 。 本 书 之 前 对 于 如 何 传递 参数 的 讨论 , 对 返回 值 也 是 适用 的 (参见 8. 5.6 节 )。 


8.7 名 字 空 间 


在 函数 中 我 们 用 程序 块 来 组 织 代码 (参见 8.4 节 )。 我 们 用 类 来 将 函数 、 数 据 和 类 型 组 织 到 一 
个 类 型 中 (参见 第 9 章 ) 。 函 数 和 类 都 为 我 们 做 了 如 下 工作 : 

。 人 允许 我 们 定义 大 量 实体 , 而 无 需 担 心 它们 的 名 字 与 程序 中 其 他 实体 的 名 字 有 冲突 。 

。 为 我 们 提供 了 一 个 名 字 , 用 来 访问 我 们 定义 的 东西 。 
至 此 , 我 们 还 缺少 一 种 技术 , 无 需 定义 一 个 类 型 就 能 将 类 、 晴 数 、 数据 和 类 型 组 织 成 一 个 可 识别 
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的 命名 实体 。 实 现 这 种 声明 分 组 功能 的 C++ 机制 就 是 名 字 空 间 (namespace) 。 例 如 , 我 们 希望 提 


供 一 个 包含 类 Color、Shape、Line 、Function 和 Text 的 绘图 库 ( 参 见 第 13 章 ) : 
namespace Graph_iib { 
struct Color {/* ...*/); 
struct Shape {/*...*/); 
struct Line : Shape {/* ..."*/); 
struct Function : Shape {/* ...*/); 
struct Text : Shape {/* ...*/); 
1... 
int gui_mainO) {/* ..."*/} 
} 


很 可 能 其 他 人 也 使 用 了 这 些 名 字 , 但 没有 关系 。 你 可 以 定义 名 为 Text 的 实体 , 但 与 我 们 的 Text 没有 
冲突 。Graph_lib :: Text 是 我 们 定义 的 类 , 而 你 的 Text 与 之 不 同 。 唯 一 可 能 有 问题 的 情况 就 是 , 你 也 
定义 了 一 个 名 为 Graph_lib 的 类 或 名 字 空 间 , 它 也 包含 一 个 名 为 Text 的 成 员 。Graph_lib 这 个 名 字 有 
点 丑 ， 我 们 选择 它 的 原因 是 , “漂亮 且 清 晰 "的 名 字 Graphics 有 很 大 可 能 已 经 被 别人 用 过 了 。 

假设 你 的 Text 是 一 个 文字 处 理 库 的 一 部 分 。 我 们 用 来 将 绘图 功能 组 织 到 名 字 空 间 Craph_lib 
中 的 思想 , 也 可 用 来 将 你 的 文字 处 理 功能 组 织 到 一 个 叫 其 他 名 字 ( 比如 TextLib ) 的 名 字 空 间 : 


namespace TextLib { 
class Text {/* ..."*/); 
class Glyph {/* ...*/); 
class Line {/ ..."*/); 
/a 

} 


如 果 我 们 定义 的 这 两 个 名 字 空 间 都 是 全 局 的 , 我 们 可 能 会 陷入 真正 的 麻烦 之 中 。 假 如 有 人 同时 使 
用 我 们 的 这 两 个 库 ， 就 可 能 真 的 遇 到 名 字 冲 突 , 如 Text 和 Line。 粳 糕 的 是 ,如 果 我 们 的 两 个 库 都 
有 用 户 在 使 用 , 我 们 就 无 法 通过 修改 Line 和 Text 这 些 名 字 来 避免 冲突 ,否则 用 户 程序 也 必须 修 
改 。 为 了 解决 这 一 问题 , 我 们 可 以 使 用 名 字 空 间 ， 即 我 们 的 Text 用 Graph_lib :: Text 表示 , 你 的 
Text 用 TextLib :: Text。 这 种 将 一 个 名 字 空 间 的 名 字 ( 或 一 个 类 名 ) 和 一 个 成 员 名 用 :: 组 合成 的 名 字 
称 为 全 限定 名 (fully qualified name) 。 
8.7.1 using 声明 和 using 指令 

使 用 全 限定 名 太 繁 琐 了 。 例 如 ,C++ 标准 库 的 功能 都 定义 在 std 名 字 空 间 中 , 因此 可 以 按 如 


下 方式 使 用 : 
#include<string> // get the string library 
##include<iostream> // get the iostream library 
int main() 
{ 


std::string name; 

std::cout << "Please enter your first name\n"; 
std::cin >> name; 

std: :cout << "Hello, " << name << \n'; 


} 
我 们 已 经 见 过 标准 库 中 的 string 和 cout 无 数 次 了 , 我 们 真 不 希望 必须 用 “正确 的 ”全 限定 名 std :: 
string 和 std :: cout 才能 访问 它们 。 如 果 有 这 人 么 一 种 方法 , 能 实现 “ 当 我 说 string, 我 的 意思 是 std :: 
string”、“ 当 我 说 cout, 我 的 意思 是 std :: cout” 等, 那 就 好 了 , 就 像 下 面 这 样 : 


using std: :string;  // string means std::string 
using std::cout; // cout means std::cout 
1 
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这 种 语法 结构 称 为 using 声明 , 它 与 我 们 常用 的 人 名 简称 类 似 : 你 可 以 简单 地 用 ”Greg "来 代表 
Greg Hansen， 只 要 屋子 里 没有 其 他 叫 Greg 的 人 就 没 问 题 。 

有 时 ，, 我 们 希望 可 以 有 一 种 更 强 的 “简称 ”用 来 引用 名 字 空 间 中 的 名 字 :“ 如 果 你 在 本 作用 域 
中 没有 发 现 某 个 名 字 的 声明 , 那么 就 在 std 中 寻找 它 ”。 使 用 using 指令 可 以 达到 这 个 目的 : 

using namespace std; //make names from std directly accessible 


于 是 我 们 得 到 了 下 面 这 种 常用 的 程序 风格 : 


有 nclude<string> // get the string library 
#include<iostream> // get the iostream jibrary 
using namespace std; //make names from std directly accessible 


int main() 

{ 
string name; 
cout << "Please enter your first name\n"; 
cin >> name; 


cout << "Hello, " << name << \n'; 


} 
其 中 cin 表示 std :: cin ，string 表示 std :: string, 依 此 类 推 。 只 要 你 使 用 std_lib_facilities. h, 你 就 不 
需要 担心 标准 库 头 文件 和 std 名 字 空 间 了 。 

一 个 一 般 性 的 原则 是 , 除非 是 std 这 种 在 某 个 应 用 领域 中 大 家 已 经 非常 熟悉 的 命名 空间 , 否 
则 最 好 不 要 使 用 using 指令 。 过 度 使 用 using 指令 带 来 的 问题 是 , 你 已 经 记 不 清 每 个 名 字 来 自 哪 
里 , 结果 就 是 你 又 陷入 名 字 冲 突 之 中 。 显 式 使 用 全 限定 名 , 或 者 使 用 using 声明 就 不 存在 这 个 问 
题 。 因 此 , 将 一 个 using 指令 放 在 头 文件 中 是 一 个 非常 坏 的 习惯 , 因为 用 户 就 无 法 避免 上 述 问题 。 
然而 , 为 了 简化 初学 者 编写 程序 , 我 们 确实 在 std_lib_facilities. h 中 为 std 放置 了 一 个 using 指令 ， 
因此 我 们 可 以 像 下 面 代 码 这 样 来 写 程序 : 


机 nciude *std ilib facilities.hy 


int main() 
{ 
string name; 
cout << "Please enter your first name\n"; 
cin >> name; 
cout << "Hello, ” << name << \n'; 
} 
对 于 除 std 之 外 的 名 字 空 间 , 我 们 保证 不 会 这 样 做 。 
起》 简单 练习 


]. 创建 三 个 文件 : my. h、 二 cpp 和 use. cpp。 头 文件 my.h 包含 : 
extern int foo; 
void print_foo(); 

void print(int); - | 
源 文件 my. cpp 包含 my. h 和 std_lib_facilities. h, 定义 print_foo( ) ， 此 函数 用 cout 来 打印 foo 的 值 ，my. cpp 
中 还 应 定义 函数 print(int i) , 用 cout 打印 i 的 值 。 
源 文 件 use. cpp 包含 my. h, 定义 主 函 数 main( ) , 主 函 数 中 将 foo 的 值 置 为 7, 用 print_foo( ) 打印 它 , 并 用 
print( ) 打印 整 型 值 99。 注 意 use. cpp 并 不 包含 std_lib_facilities. h,， 因 为 它 并 不 直接 使 用 标准 库 中 的 功能 。 
编译 并 运行 这 些 文件 。 在 Windows 平台 上 , 你 需要 将 use. cpp 和 my. cpp 放 在 同一 个 项 目 中 , 并 在 use. cpp 
中 使 用 | char ce; cin >> cc; | 来 看 到 输出 结果 。 

2. 编写 三 个 晴 数 swap_v(int，int) 、swap_r(int&，int&) 和 swap_cr( const int&，const int&)。 每 个 函数 有 如 下 
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晴 数 体 : 
{ int temp; temp = a, a=b; b=temp; } 
其 中 a 和 b 是 参数 名 。 
尝试 用 如 下 代码 调用 这 三 个 函数 : 
int x=7; 
int y =9; 
swap_?(x,y); /replace? by v, tr, or cr 
swap..?(7,9); 
const int cx = 7; 
const int cy = 9; 
swap_? (cx,cy); 
swap_?(7.7,9.9); 
doubie dx = 7.7; 
double dy = 9.9; 

swap_?(dx,dy); 
swap_?(dx,dy); 
哪个 调用 能 编译 通过 ? 为 什么 ?对 每 个 编译 通过 的 swap 调用 ,在 其 调用 过 后 打印 参数 的 值 , 检查 参数 什 
是 否 真正 被 交换 了 。 如 果 你 不 理解 得 到 的 结果 , 查阅 8.6 也。 

3. 编写 一 个 程序 ,由 一 个 文件 组 成 ,其 中 包含 三 个 名 字 空 间 X、Y 和 Z, 使 得 如 下 main( ) 函数 能 正确 运行 : 


int main() 
{ 
X::Var=7; 
X::printO); / print X's var 
using namespace Y; 
Var = 9; 
print(); .HprintY’s var 


{ using Z::var; 

using Z::print; 

var=11 2 

print0; NprintZ’s var 
} 
print(); / print Y's var 
X::print(); // print X's var 

} 


每 个 名 字 空 间 需 定义 一 个 名 为 var 的 变量 和 一 个 名 为 print( ) 的 函数 , 该 函数 用 cout 输出 恰当 的 var 值 。 
人 思考 题 
. 声明 和 定义 有 何 区 别 ? 
.如 何 从 语法 上 区 分 函数 声明 和 函数 定义 ? 
.如 何 从 语法 上 区 分 变量 声明 和 变量 定义 ? 
， 对 于 第 6 章 的 计算 器 程序 中 的 函数 ,为 什么 不 先 声 明 就 无 法 使 用 ? 
.int a; 是 一 个 定义 , 还 是 只 是 一 个 声明 ? 
.为 什么 说 在 变量 声明 时 对 其 初始 化 是 一 个 好 的 编程 风格 ? 
一 个 函数 声明 可 以 包含 哪些 内 容 ? 
. 恰当 使 用 缩 进 有 什么 好 处 ? 
. 头 文件 的 用 处 是 什么 ? 
. 什么 是 声明 的 作用 域 ? 
.有 几 种 作用 域 ? 请 各 举 一 例 。 
. 类 作用 域 和 局 部 作用 域 有 何 区 别 ? 
3. 为 什么 应 该 尽量 少 用 全 局 变量 ? 
. 传 值 和 传 引用 有 何 区 别 ? 
15. 传 引用 和 传 常量 引用 有 何 区 别 ? 


a 


phd 
心 [> 一 号 
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.什么 是 swap( )? 

， 定 义 一 个 函数 ,， 它 带 有 一 个 vector < double > 类 型 的 传 值 参 数 , 这 样 做 好 取 ? 

给 出 一 个 求 值 顺序 不 确定 的 例子 ,并 说 明 为 什么 求 值 顺序 不 确定 是 一 个 问题 。 
，x&&y 和 xl17 分 别 表示 什么 ? 

. 下 面 哪些 语法 结构 符合 C++ 标准 : 肾 数 中 的 函数 、 类 中 的 丞 数 、 类 中 的 类 、 星 数 中 的 类 。 
. 一 个 活动 记录 内 都 包含 什么 内 容 ? 

. 什么 是 调用 栈 ? 为 什么 需要 调用 栈 ? 

.名字 空间 在 作用 是 什么 ? 

. 名 字 空 间 和 类 有 何 区 别 ? 

.using 声明 是 什么 ? 

， 为 什么 应 该 避免 在 头 文件 中 使 用 using 指令 ? 

7. 命名 空间 std 是 什么 ? 


人 不 


活动 记录 汞 数 定义 传 值 实 参 全 局 作用 域 递归 

参数 传递 头 文件 return 调用 栈 初始 化 程序 ”. 返回 值 

类 作用 域 局 部 作用 域 作用 域 const namespace 语句 作用 域 
声明 名 字 空 间作 用 域 技术 细节 定义 嵌 套 语句 块 未 定义 标识 符 
extem 形 参 using 声明 ”前 置 声明 传 常 量 引 用 using 指令 
函数 传 引 用 


<=》 习题 


1. 修改 第 7 章 的 计算 器 程序 , 将 输入 流 作 为 一 个 显 式 参 数 ( 如 8. 5. 8 节 所 示 )。 并 为 Token_stream 设计 接受 


istream& 参数 的 构造 函数 , 这 样 ， 当 我 们 解决 了 如 何 使 用 自己 的 输入 流 时 (如 关联 到 一 个 文件 ) ， 就 可 以 
将 之 用 于 计算 器 程序 。 


.编写 一 个 函数 print( ) , 将 一 个 整 型 向 量 输 出 到 cout。 此 函数 接受 两 个 参数 : 一 个 字符 串 ( 用 于 "标记 ”" 输 


出 ) 和 一 个 回 量 。 


. 创建 一 个 斐 波 那 契 数 的 向 量 , 并 用 习题 2 中 的 函数 输出 这 个 向 量 。 编 写 函 数 fibonacci(x, y, v. n) 来 创建 


向量 , 其 中 x、y 是 int 型 , v 是 vector <int > 类 型 空 向 量 , n 是 要 放 人 v 的 元 素数 目 , 将 v[0] 和 [1] 分 别 
设置 为 x 和 ye 斐 波 那 契 数列 是 这 样 一 个 整 型 序列 ,其 中 每 个 元 素 都 是 前 面 两 个 元 素 之 和 。 例 如 , 以 1 和 
2 开始 , 可 以 得 到 斐 波 那 契 数列 1、2、3、5、8、13、21、…。 你 设计 的 fibonacci( ) 函数 应 该 以 参数 x 和 7y 作 
为 开始 , 生成 这 样 的 辈 波 那 契 数列 。 


.计算 机 中 int 型 对 象 能 保存 的 整数 的 值 是 有 上 限 的 。 使 用 fibonacci( ) 函数 求 这 个 上 限 的 近似 值 。 
.编写 两 个 函数 , 反 转 一 个 vector < int > 类 型 向 量 中 的 元 素 顺序 。 例 如 , 将 1、3、5、7、9 转换 为 9、7、5、3、 


1。 第 一 个 反 转 函数 生成 一 个 新 向 量 , 其 中 元 素 为 原 向 量 的 逆序 , 而 原 向 量 内 容 不 变 。 男 一 个 反 转 函数 不 
使 用 任何 其 他 向 量 , 直接 在 原 向 量 中 反 转 元 素 顺序 (提示 : 用 swap)。 


。 对 vector < string > 类 型 向 量 , 重 做 习题 5。 
. 读 人 5 个 名 字 , 存 人 一 个 vector < string > 型 向 量 name， 然 后 提示 用 户 输入 这 些 人 的 年 龄 , 存 人 一 个 vector 


< double > 型 向 量 age。 然 后 打印 5 对 (name[i]，age[i])。 然 后 对 和 名字 排序 (sort ( name. begin( ) ， 
name. end( ) ) ) , 并 输出 (name[i] ，age[i] ) 对。 此 题 的 难点 在 于 ,如 何 使 age 向 量 中 元 素 的 次 序 与 已 排序 
的 name 问 量 中 的 元 素 匹 配 。 提 示 : 在 排序 name 之 前 , 将 它 复 制 一 份 , 在 排序 之 后 , 利用 此 副本 生成 顺序 
正确 的 age 副本 。 完 成 后 , 重 做 此 题 , 使 之 能 处 理 任意 数目 的 姓名 和 年 龄 。 


， 编写 一 个 简单 函数 randint( ) , 它 生成 一 个 [0:MAXINT] 之 间 的 伪 随 机 数 。 提 示 : 参考 Knuth 的 《The Art of 


Computer Programming》 第 2 版 。 


.编写 一 个 函数 rand_in_range( int a, int b), 它 使 用 习题 8 的 函数 randint( ) 生 成 [a:b) 之 间 的 一 个 伪 随 机 


数 。 注 意 : 此 函数 对 于 简单 的 游戏 程序 非常 有 用 。 
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10. 编写 一 个 函数 , 接受 两 个 vector < double > 型 参数 price 和 weight, 计算 出 一 个 值 (“指数 ”) 一 一 所 有 price 
[i] * weight[ ij 之 和 。 注 意 , 我 们 必须 保证 weight. size( ) <= price. size( ) 。 

11. 编写 一 个 函数 maxv( ) , 返回 一 个 vector 参数 中 的 最 大 元 素 。 

12. 编写 一 个 函数 , 接受 一 个 vector 参数 , 找到 最 小 和 最 大 的 元 素 , 并 计算 均值 和 中 位 值 。 不 要 使 用 全 局 变 
量 。 或 者 返回 一 个 struct, 包含 所 有 计算 结果 ; 或 者 通过 引用 参数 将 所 有 计算 结果 返回 。 这 两 种 返回 多 
个 结果 的 方法 中 , 你 更 倾向 于 哪个 ? 为 什么 ? 

13. 改进 8. 5.2 节 中 的 print_until_s( ), 并 测试 它 。 什 么 样 的 测试 用 例 集 能 更 好 地 测试 此 程序 ? 请 解释 原因 。 
然后 , 编写 一 个 print_until_ss( ) 函数 ， 它 会 一 直 打印 , 直至 第 二 次 看 到 它 的 quit 参数 。 

14. 编写 一 个 函数 , 接受 一 个 vector < string > 参数 , 返回 一 个 vector < int > ,其 每 个 元 素 值 是 对 应 字符 串 的 长 
度 。 此 函数 还 找 出 最 长 和 最 短 的 字符 串 ,， 以 及 字典 序 第 一 个 和 最 后 一 个 字符 串 。 为 了 完成 这 些 工 作 , 你 
需要 用 多 少 个 独立 的 函数 ? 为什么? 

15. 能 声明 一 个 非 引用 的 常量 参数 吗 (如 void f( const int) ; )? 这 种 参数 传递 方式 意味 着 什么 ? 为 什么 我 们 可 
能 需要 这 种 传 参 方式 ? 为 什么 我 们 不 应 该 经 常 使 用 这 种 方式 ? 编写 几 个 小 程序 来 尝试 这 种 传 参 方式 ， 
观察 效果 。 


》 附 言 


我 们 可 以 将 本 章 ( 以 及 第 9 章 ) 的 大 部 分 内 容 放 入 附录 。 然 而 , 你 需要 了 解 本 章 介 绍 的 大 部 分 C++ 功 
能 ,以 便 学 习 本 书 的 第 二 部 分 。 用 这 些 C++ 功能 可 以 很 快 地 解决 你 遇 到 的 很 多 问题 ,而 这 些 问题 是 你 承担 
的 一 些 简 单程 序 设计 项 目 中 所 必须 解决 的 。 因 此 , 为 了 节约 时 间 , 减少 混淆 , 本 章 系 统 地 介绍 了 这 些 内 容 ， 
而 不 是 让 读者 去 “随机 ”地 访问 手册 和 附录 。 


第 9 章 关 相 关 的 技术 细节 


“ 记 住 , 做 事情 要 花费 时 间 。” 


Piet Hein 





在 本 章 中 , 我 们 继续 关注 主要 的 程序 设计 工具 一 一 C++ 语 言 。 本 章 主要 介绍 与 用 户 自 定 义 类 
型 相关 的 语言 技术 细节 ， 即 类 和 枚 举 相关 的 内 容 。 这 些 语言 特性 , 大 部 分 是 以 逐步 改进 一 个 Date 
类 型 的 方式 来 介绍 的 。 采 用 这 种 方式 , 我 们 还 可 以 顺便 介绍 一 些 有 用 的 类 设计 技术 。 


9.1 用 户 自 定义 类 型 


C++ 语言 提供 了 一 些 内 置 类 型 ,如 char、int 和 double( 参 见 附录 A.8) 。 对 于 一 个 类 型 ， 如 果 
编译 器 无 须 借 助 程序 员 在 源码 中 提供 的 任何 声明 ， 就 知道 如 何 表示 这 种 类 型 的 对 象 以 及 可 以 对 它 
进行 什么 样 的 运算 (如 + 和 * )， 我 们 就 称 这 种 类 型 是 内 置 的 。 

非 内 置 的 类 型 称 为 用 户 自 定 义 类 型 (user-defined type，UDT) 。 用 户 自 定义 类 型 包括 每 个 ISO 
标准 C++ 实现 都 提供 给 程序 员 的 标准 库 类 型 ， 如 string 、vector 和 ostream( 人 参见 第 10 章 ) , 也 可 以 
是 我 们 为 自己 创建 的 类 型 , 如 Token 和 Token_stream( 人 参见 6.5 节 和 6.6 节 )。 一旦 我 们 掌握 了 足 
够 多 的 必要 的 语言 功能 , 我 们 就 可 以 创建 图 形 类 型 , 如 Shape、Line 和 Text( 参 见 第 13 章 ) 。 标 准 
库 类 型 很 大 程度 上 可 以 和 内 置 类 型 一 样 看 做 语言 的 一 部 分 , 但 我 们 还 是 将 它们 看 做 用 户 自 定 义 类 
型 ,因为 它们 和 我 们 自己 创建 的 类 型 使 用 了 同样 的 语言 功能 和 技术 ; 标准 库 的 开发 者 并 没有 什么 
特权 或 者 语言 工具 , 是 你 我 所 不 具备 的 。 与 内 置 类 型 相似 , 大 多 数 用 户 自 定义 类 型 提供 运算 。 例 
如 ，vector 有 [ ] 和 size( ) 运 算 ( 参 见 4.6.1 节 和 附录 B. 4. 8) ，ostream 有 << ，Token_stream 有 get() 
(参见 6.8 节 ) ,Shape 有 add( Point) 和 set_color( ) (参见 14.2 节 )。 

我 们 为 什么 要 创建 自 定义 类 型 呢 ? 原因 在 于 编译 器 不 知道 我 们 想 在 程序 中 使 用 的 所 有 类 型 。 
它 也 不 可 能 知道 , 因为 有 用 的 类 型 实在 太 多 了 一 一 没有 语言 设计 者 或 者 编译 器 开发 者 能 预知 所 有 
类 型 。 我 们 每 天 都 在 创建 新 的 类 型 。 为 什么 ? 类 型 又 有 什么 用 ? 通过 类 型 , 我 们 可 以 在 代码 中 直 
接 、 有 效 地 表达 我 们 的 思想 。 当 编写 代码 时 , 理想 情况 就 是 我 们 能 在 代码 中 直接 表达 我 们 的 思 
想 , 这 样 我 们 自己 、 同 事 以 及 编译 器 就 能 理解 代码 的 含义 。 当 我 们 想 进 行 算术 运算 时 ，int 类 型 会 
起 到 很 大 作用 ; 当 我 们 想 处 理 文 本 时 ，string 类 型 会 带 来 很 大 帮助 ; 当 我 们 想 处 理 计算 器 的 输入 
时 ，Token 和 Token_stream 会 起 到 很 大 作用 。 这 些 类 型 带 来 的 帮助 体现 在 两 个 方面 : 

e 表示 : 一 个 类 型 “知道 "如何 表 示 对 象 中 的 数据 。 

e 运算 :一 个 类 型 “知道 ”可 以 对 对 象 进行 什么 运算 。 

很 多 编程 想法 都 表现 为 这 种 模式 :“ 某 些 东 西 " 由 表示 它 当 前 值 的 一 些 数 据 ( 有 时 也 称 为 当前 状 
态 ) ， 及 一 组 可 以 应 用 其 上 的 运算 组 成 。 考 虑 一 个 计算 机 文件 、 一 个 网 页 、 一 个 烤 面 包机 、 一 台 
CD 播放 机 、 一 个 咖啡 杯 、 一 个 汽车 引擎 、 一 部 手机 或 是 一 本 电话 号 码 短 ; 每 个 对 象 都 可 以 用 一 些 
数据 描述 , 并 且 文 持 一 组 固定 的 、 数 量 或 多 或 少 的 标准 操作 。 在 每 个 例子 中 , 操作 的 结果 依赖 于 
对 象 的 数据 一 “当前 状态 ”。 

因此 , 我 们 希望 在 代码 中 将 这 样 一 个 “想法 "或 “概念 ”表示 为 一 个 数据 结构 加 上 一 组 函数 。 
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问题 是 “如 何 准确 表示 ”。 本 章 介绍 一 些 在 C++ 中 表述 概念 的 一 些 基 本 方法 , 以 及 涉及 的 一 些 语 
言 的 技术 细 他 。 

C++ 提供 了 两 类 用 户 自 定义 数据 类 型 : 类 和 枚 举 。 类 是 到 目前 为 止 最 常用 的 , 也 是 最 重要 的 
概念 描述 机 制 ， 因 此 我 们 首先 把 注意 力 放 在 类 上 。 类 能 够 在 程序 中 直接 地 表达 概念 。 一 个 类 是 一 
个 (用 户 自 定 义 ) 类 型 , 它 指出 这 种 类 型 的 对 象 如 何 表 示 , 如 何 创建 , 如 何 使 用 , 以 及 如 何 销毁 ( 参 
见 17.5 节 ) 。 如 果 你 将 某 些 东西 作为 一 个 单独 的 实体 来 考虑 , 那么 你 可 能 就 应 该 在 程序 中 定义 一 
个 类 来 表示 “这 个 东西 ” 。 这 方面 的 例子 有 向 量 、 和 矩阵 、 设 备 驱 动 、 屏 幕 上 的 图 片 、 对 话 框 、 图 形 、 
窗口 、 温 度 计 读数 以 及 时 钟 等 。 

在 C++ 中 (以 及 大 多 数 现代 程序 设计 语言 中 ) ,类 是 构造 大 型 程序 的 关键 的 基本 组 成 部 分 ， 
对 小 程序 也 同样 非常 有 用 , 这 一 点 我 们 已 经 在 计算 器 程序 中 看 到 了 (参见 第 6 章 和 第 7 章 )。 


9.2 类 和 成 员 


一 个 类 就 是 一 个 用 户 自 定义 类 型 ,由 一 些 内 置 类 型 和 其 他 用 户 自 定义 类 型 的 对 象 以 及 一 些 函 
数组 成 。 这 些 用 来 定义 类 的 组 成 部 分 称 为 成 员 (member) 。 一 个 类 可 以 有 0 个 或 多 个 成 员 , 例如 : 


class X{ 
public: 
int Mm; /1 data member 
int mf(int v) { int old = m; m=v; return old; } // function member 


}; 
成 员 可 以 有 多 种 类 别 , 大 多 数 要 么 是 数据 成 员 , 定义 了 类 对 象 的 表示 方法 ,要么 是 函数 成 员 , 提 
供 类 对 象 之 上 的 运算 。 类 成 员 的 访问 使 用 这 种 符号 : 对 象 . 成 员 。 例 如 


X var; / var is a variable of type X 
var.m =7; // assign to var’s data member m 
int x = varmf(9);  // call vars member function mf(} 


你 可 以 把 var. m 读 做 “var 的 m”, 大 多 数 人 读 做 “var 点 m” 或 者 “var 的 m”。 一 个 成 员 的 类 型 决定 
我 们 可 以 对 它 进 行 什么 运算 。 例 如 , 我 们 可 以 读 / 写 一 个 int 成 员 , 可 以 调用 一 个 函数 成 员 , 等 等 。 


9.3 ”接口 和 实现 


我 们 通常 把 一 个 类 看 做 一 个 接口 加 上 一 个 实现 。 接 口 是 类 声明 的 一 部 分 , 用 户 可 以 直接 访问 
它 。 实 现 是 类 声明 的 另 一 部 分 , 用 户 只 能 通过 接口 间接 访问 它 。 公 共 的 接口 用 标号 public: 标 识 ， 
实现 用 标号 private: 标 识 。 你 可 以 将 一 个 类 声明 理解 为 如 下 形式 : 
class X{ /thisclass’s name is X 
pvublic: 
// public members: 
li! -the interface to users (accessible by ail) 
/ functions 
// types 
// data (often best Sop private) 
private: 
// private members: 
1/ -theimplementation details (used by members of this class onjy) 
// functions 
// types 
1 data 
上 


类 成 员 默 认 是 私有 的 ,也 就 是 说 , 如 以 下 代码 所 示 : 
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class X{ 
int mf(int); 
Mss 

}; 


等 价 于 


class X{ 

private: 
int mf(int); 
1 

}; 


因此 ,下面 的 代码 是 错误 的 


Xx; 1 variable x of type X 
int y = x.mf(); / error: mf is private (i.e., inaccessible) 
用 户 不 能 直接 访问 一 个 私有 成 员 , 应 通过 一 个 公有 函数 来 访问 ,例如 
class X { 
int m; 
int mf(int); 
public: 


int fint i) { m=i; return mf(i); } 


}; 

XxX; 

int y = x.f(2); 
我 们 用 私有 和 公有 之 间 的 差别 来 描述 接口 (类 的 用 户 视图 ) 和 实现 细节 (类 的 实现 者 视图 ) 之 间 的 
重要 区 别 。 下 面 我 们 会 逐步 给 出 解释 和 大 量 实例 , 在 此 我 们 仅仅 指出 : 如 果 类 只 包含 数据 ,接口 
和 实现 间 的 区 别 没 有 什么 意义 。C++ 提供 了 一 种 很 有 用 的 简化 的 功能 , 可 用 来 描述 没有 私有 实现 
细节 的 类 。 这 种 语法 功能 就 是 结构 , 一 个 结构 就 是 一 个 成 员 默认 为 公有 属性 的 类 : 

struct X{ 


int m; 
Tans 


/pe 
}; 


结构 主要 用 于 成 员 可 以 取 任 意 值 的 数据 结构 , 即 我 们 不 能 定义 任何 有 意义 的 不 变 式 ( 参 见 9.4.3 节 )。 
9.4 演化 一 个 类 


下 面 , 让 我 们 展示 如 何 、 以 及 为 什么 , 将 一 个 简单 数据 结构 逐步 演化 为 一 个 具有 私有 实现 细 
节 和 支持 函数 的 类 , 我 们 通过 这 些 内 容 来 说 明 支 持 类 的 语言 功能 和 使 用 类 的 基本 技术 。 我 们 对 这 
些 内 容 的 介绍 借助 于 一 个 非常 普通 的 问题 一 一 如 何在 程序 中 表示 日 期 (如 1954 年 8 月 14 日 )。 很 
显然 , 很 多 程序 都 需要 日 期 , 如 商业 事务 程序 、 天 气 数据 程序 、 日 程 表 程序 、 工 作 记录 、 库 存 管理 
程序 等 。 唯 一 的 问题 是 , 我 们 如 何 才能 表示 它 。 
9. 4. 1 ”结构 和 函数 

我 们 如 何 才 能 表示 一 个 日 期 呢 ? 当 我 们 提出 这 个 问题 时 , 很 多 人 会 回答 :“ 年 、 月 、 日 , 这样 
表示 如 何 ?” 这 不 是 唯一 的 答案 , 也 不 总 是 最 好 的 答案 , 但 目前 对 我 们 来 说 够 用 了 , 这 也 是 我 们 将 
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要 采用 的 做 法 。 我 们 的 第 一 个 方案 是 一 个 简单 的 结构 : 
// simple Date {too simple?) 
struct Date { 
inty; /year 
int m; /month in year 
int d; / day of month 
}; 


Date today; //a Date variable (a named object) 
一 个 Date 对 象 (如 today ) 由 三 个 整 型 简单 构成 , 如 下 图 所 示 。 这 个 Date 结构 pe 
不 存在 任何 关联 的 隐藏 数据 结构 , 能 “ 变 出 戏法 ”一 一 而 且 本 章 中 Date 的 任何 “ 
一 个 版 本 也 都 是 这 样 。 
现在 已 经 有 了 表示 日 期 的 Date, 我 们 可 以 对 它 进行 什么 操作 呢 ? 实际 上 
我 们 能 做 任何 操作 ， 因 为 我 们 可 以 访问 today( 以 及 任何 其 他 Date 对 象 ) 的 成 员 , 可 以 按 我 们 的 意 
愿 读 写 它们 。 困 难 在 于 事情 确实 不 是 那么 方便 , 我 们 想 对 一 个 Date 对 象 做 任何 事 , 都 必须 通过 读 
写 其 成 员 的 方式 来 进行 , 例如 : 


// set today to December 24, 2005 
today.y = 2005; 

today.m = 24; 

today.d = 12; 


这 样 编写 程序 见长 乏味 , 而 且 容 易 出 错 。 你 能 看 出 上 面 代 码 中 的 错误 吗 ? 实际 上 , 任何 元 长 乏味 
的 东西 都 容易 出 错 ! 例如 ,下 面 代码 有 任何 意义 吗 ? 


Date x; 

XY 二 一 3; 
x.m = 13; 
x.d = 32; 


很 有 可 能 是 没有 意义 的 , 而 且 没 有 人 会 这 么 写 程序 。 再 考虑 下 面 的 程序 : 


Date y; 
y.y = 2000; 
ym=2; 
y.d = 29; 


看 起 来 比 上 一 段 程序 有 意义 得 多 , 但 2000 年 是 周年 吗 ? 你 确定 ? 

较 好 的 方法 是 设计 一 些 辅助 函数 , 来 为 我 们 完成 一 些 最 常见 的 操作 。 采 用 这 种 方法 , 我 们 不 
必 一 再 重复 相同 的 代码 , 也 不 必 一 再 犯 同 样 的 错误 ,以 及 查找 、 修正 这 些 错误 。 几 乎 对 于 每 个 类 
型 , 初始 化 和 赋值 都 属于 最 常用 的 操作 。 对 Date 来 说 , 增加 日 期 的 值 是 另 一 个 常用 操作 ,， 于 是 我 
们 可 以 编写 如 下 辅助 函数 : 


// helper functions: 





void init_day(Date& dd, int y, int m, int d) 


// check that (y,m,d) is a valid date 
I if it is, use it to jnitiajize dd 


} 


void add_day(Date& dd, int n) 
{ 
// increase dd by n days 


} 
现在 我 们 可 以 试 着 使 用 Date 了 : 
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void f() 

{ 
Date today; 
init_day(today, 12, 24, 2005); I/ oops! (no day 2005 in year 12) 
add_day(today,1); 

} 


首先 , 我 们 注意 到 这 些 操作 (这 里 实现 为 辅助 函数 ) 是 很 有 用 的 。 如 果 我 们 没有 一 劳 永 逸 地 编写 一 
个 日 期 检查 程序 的 话 , 检查 日 期 将 会 是 非常 困难 和 乏味 的 , 我 们 有 时 可 能 会 息 记 写 检查 代码 ， 从 
而 得 到 充斥 错误 的 程序 。 每 当 定义 一 个 类 型 时 , 我 们 都 会 需要 一 些 针对 该 类 型 对 象 的 操作 。 而 到 
底 需要 多 少 个 操作 , 需要 什么 类 型 的 操作 , 不 同 的 类 型 各 不 相同 。 我 们 如 何 来 实现 这 些 操作 ( 实 
现 为 函数 或 成 员 函 数 或 运算 符 ) 也 是 不 同 的 。 但 只 要 是 决定 定义 一 个 类 型 ,我们 都 要 问 一 下 自己 : 
“我 们 想 要 为 这 个 类 型 设计 什么 样 的 操作 ?” 
9. 4.2 成 员 函 数 和 构造 函数 

我 们 为 Date 设计 了 一 个 初始 化 函数 , 它 提供 了 重要 的 日 期 合法 性 检查 功能 。 然 而 , 如 果 我 们 
使 用 不 当 的 话 , 日 期 检查 功能 将 毫 无 用 处 。 例 如 , 假定 我 们 已 经 为 Date 定义 了 输出 运算 符 << ( 参 


见 9.8 节 ); 
vold f() 


{ 
Date today; 
I 


cout << today << An'; /use today 
| 

init_day(today,2008,3,30); 

A 

Date tomorrow; 

tomorrow.y = today,y; 

tomorrow.m = today.m; 

tomorrow.d = today.d+1; /add 1 to today 
cout << tomorrow << "Nn'; 1 use tomorrow 


} 
这 有 段 代码 中 , 我 们 定义 today 后 ,“ 忘 记 了 "立即 对 它 进行 初始 化 , 而 “ 某 人 "在 我 们 及 时 调用 init_ 
day( ) 之 前 就 使 用 了 它 。 而 且 “ 某 人 ”认为 调用 add_day( ) 浪 费时 间 , 或 许 他 根本 没 听 说 过 这 个 函 
数 , 因此 他 亲手 构造 了 tomorrow 而 不 是 调用 add_day( ) 。 由 于 这 些 情 况 磁 巧 发 生 , 这 个 程序 变 成 
了 一 段 问题 代码 一 一 而 且 问 题 非常 严重 。 有 时 , 而 且 可 能 是 大 多 数 时 候 , 它 工 作 正 常 ,但 一 些小 
的 改变 就 可 能 导致 严重 的 错误 。 例 如 , 一 个 未 初始 化 的 Date 会 产生 垃圾 输出 , 而 简单 地 为 成 员 变 
量 d 加 1 来 推移 日 期 会 成 为 定时 炸弹 ; 当 today 表示 月 底 那 一 天 时 , 加 1 操作 会 导致 一 个 非法 的 日 
期 。 这 段 * 问题 严重 的 代码 "最 大 的 问题 是 ,， 它 看 起 来 似乎 没什么 问题 。 

上 述 思 考 促使 我 们 寻找 更 好 的 操作 实现 方式 , 我 们 需要 不 会 被 程序 员 息 记 的 初始 化 函数 , 帘 
要 被 忽视 的 可 能 性 很 低 的 操作 。 实 现 这些 目 标的 基本 技术 就 是 成 员 函 数 (member function) ， 即 将 
盟 数 声明 于 类 体 , 作为 类 的 成 员 。 例 如 ; 


让 simple Date 
1 guarantee initialization with constructor 
/I provide some notational convenience 


struct Date { 
int y, m, d; I year, month, day 
Datelint y int m, int d); /check for valid date and initialize 
void add_day(int n); I increase the Date by n days 


}; 
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与 类 同名 的 成 员 函 数 是 特殊 的 成 员 函 数 , 称 为 构造 函数 (constructor), 专门 用 于 类 对 象 的 初始 化 
(“构造 ”) 。 如 果 一 个 类 具有 需要 参数 的 构造 函数 ， 而 程序 员 忘记 利用 它 初 始 化 类 对 象 , 则 编译 器 
会 捕获 这 个 错误 。C++ 提供 了 一 种 专用 的 , 而 且 很 方便 的 语法 来 进行 这 种 初始 化 , 例如 : 


Date my_birthday; H error: my_birthday not initialized 
Date today(12,24,2007); / oops! run-time error 

Date last(2000, 12, 31); /OK (colloquial style) 

Date christmas = Date(1976,12,24); /also OK (verbose style) 


试图 声明 my_birthday 的 语句 是 错误 的 ， 因 为 我 们 没有 指定 所 需 的 初 值 。 试 图 声明 today 的 语句 会 
编译 通过 , 但 构造 函数 中 的 检查 代码 会 在 运行 时 捕获 非法 的 日 期 (12 年 24 月 2007 日 , 不 存在 这 
样 的 日 期 )。 

定义 last 的 语句 提供 了 初 值 一 一 Date 的 构造 函数 所 需 的 参数 , 位 置 是 在 紧 跟 变量 名 的 括号 
中 。 对 于 一 个 具有 带 参 数 的 构造 函数 的 类 , 这 是 最 常见 的 类 变量 初始 化 方式 。 我 们 也 可 以 用 一 种 
更 为 哆 嗪 的 方式 : 显 式 地 创建 一 个 对 象 (在 此 处 , 是 Date(1976, 12, 24) ) ,然后 通过 赋值 方式 用 
此 初 值 对 变量 进行 初始 化 ,， 如 上 面 代码 中 对 christmas 的 初始 化 。 除 非 你 确实 喜欢 打字 , 否则 你 很 
快 就 会 厌烦 这 种 方式 。 

现在 , 我 们 可 以 试 着 使 用 新 定义 的 这 些 变 量 : 


jast.add_day(1); 
add_day(2); jerror: what date? 


注意 , 成 员 函 数 add_day( ) 必须 对 特定 的 Date 对 象 进行 调用 , 语法 是 使 用 成 员 访问 符号 “. ”。 我 
们 会 在 9. 4. 4 节 介 绍 如 何 定义 一 个 成 员 函 数 。 
9. 4.3 保持 细节 私有 性 

现在 , 我 们 还 有 一 个 问题 没有 解决 : 如 果 有 人 忘 了 使 用 成 员 函 数 add_day( ) 怎么 办 ? 如 果 有 
人 决定 直接 修改 月 份 怎 么 办 ? 毕竟 , 我 们 “ 忘 了 ”提供 这 些 功 能 : 


Date birthday(1960,12,31); // December 31, 1960 





++birthday,d; / ouch! invalid date 
Date today(1970,2,3); 
today.m = 14; 1 ouch! invalid date 


只 要 我 们 还 是 将 Date 的 描述 暴露 给 所 有 人 , 那么 就 会 有 人 (无 意 或 有 意 地 ) 把 事情 搞 乱 一 一 也 就 
是 制造 出 非法 的 日 期 值 。 例 如 上 面 的 代码 , 就 创建 了 日 历 上 不 存在 的 日 期 。 这 样 的 非法 对 象 会 成 
为 定时 炸弹 ; 在 有 人 使 用 它 之 前 , 它 只 不 过 是 个 时 间 值 , 但 一 旦 有 人 使 用 这 样 的 非法 时 间 ， 就 会 
发 生 运行 时 错误 , 而 通常 情况 会 更 糟 , 程序 会 生成 错误 的 结果 。 

上 述 担忧 使 我 们 得 到 如 下 结论 : Date 的 描述 对 用 户 来 说 应 该 是 不 可 访问 的 , 除非 是 通过 类 中 
提供 的 公有 成 员 函 数 来 访问 。 下 面 是 按 这 种 思想 改进 后 的 第 一 个 版 本 : 


1 simple Date (control access) 
class Date { 
int y, m, d; / year month, day 
public: 
Date(inty, int m, intd); // check for valid date and initiaiize 
void add_day(int n); / increase the Date by n days 
int month() { return m; } 
int day() { return d; } 
int year() { return y; } 
}; 


使 用 新 版 Date 的 示例 如 下 : 
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Date birthday(1970, 12, 30); /OK 
birthday.m = 14; I error: Date::m is private 
cout << birthday.month() <<endl; /we provided a way to read m 


“有 效 日 期 ”的 概念 是 有 效 值 思想 的 一 个 重要 特例 。 我 们 在 设计 类 型 时 , 设法 保证 有 效 值 。 即 我 们 
隐藏 类 描述 , 提供 一 个 创建 有 效 对 象 的 构造 函数 , 所 有 成 员 函 数 的 设计 也 遵循 接受 有 效 值 、 生 成 
有 效 值 的 原则 。 对 象 的 值 通常 称 为 状态 , 因此 , 有效 值 的 思想 通常 称 为 对 象 的 有 效 状 态 。 

我 们 可 以 不 在 每 次 使 用 对 和 象 时 都 进行 有 效 性 检查 , 代 之 以 期 望 没 有 人 到 处 散布 无 效 值 。 经 验 
表明 ,“ 期 望 ” 可 以 导致 “很 漂亮 的 程序。 但是,“ 很 漂亮 的 ”程序 偶尔 会 产生 错误 的 结果 或 者 月 
溃 , 因 此, 作为 一 名 专业 人 员 , 编写 这 样 的 程序 是 不 能 赢得 朋友 和 声望 的 。 我 们 宁愿 编写 那 种 可 
被 证 明正 确 性 的 代码 。 

判定 有 效 值 的 规则 称 为 不 变 式 (invariant) 。Date 的 不 变 式 一 一 “一 个 Date 对 象 必 须 表 示 过 去 、 
现在 或 将 来 的 某 一 天 "是 一 个 少见 的 例子 , 它 很 难 表述 准确 : 我 们 需要 考虑 周年 、 格 里 高 利 历法 、 
时 区 等 。 但 是 , 如 果 只 是 用 于 特定 实际 应 用 , 我 们 还 是 可 以 给 出 Date 的 不 变 式 的 。 例 如 ， 如 果 分 
析 互 联网 日 志 , 我 们 就 无 须 为 格 里 高 利 历 、 儒 略 历 或 是 玛雅 历 而 困扰 。 如 果 我 们 不 能 想 出 一 个 完 
美的 不 变 式 , 那 我 们 可 能 就 要 处 理 普 通 数 据 。 如 果 是 这 样 , 我 们 可 以 使 用 stmet。 

9.4.4 ”定义 成 员 函 数 

到 目前 为 止 , 我 们 已 经 以 一 个 接口 设计 者 和 一 个 用 户 的 角度 考察 了 Date, 但 我 们 迟早 要 实现 
这 些 成 员 函 数 。 第 一 步 , 我 们 先 给 出 Date 类 声明 的 一 个 重新 组 织 过 的 子 集 , 它 展 示 了 适合 于 描述 
公共 接口 的 一 般 风格 : 

// simple Date (some people prefer impjementation details last) 

class Date { 

public: 

Date(int y, int m, int d); // constructor check for valid date and initialize 
void add day(intn); /increase the Date by n days 
int month(); 
as 
private: 


int y, m, d; // year month, day 
}; 


人 们 把 公共 接口 放 在 类 的 开始 , 是 因为 接口 是 大 多 数 人 最 感 兴趣 的 。 理 论 上 , 用 户 无 需 了 解 类 的 
实现 细节 ， 只 需 知 道 接口 即 可 。 实 际 上 , 我 们 通常 会 有 好 奇 心 , 会 快速 浏览 一 下 类 的 实现 , 看 看 
它 是 否 合理 , 我 们 是 否 能 从 中 学 到 一 些 技术 。 但 是 , 除非 我 们 就 是 实现 者 , 否则 我 们 会 倾向 于 在 
公有 接口 上 花 更 多 的 时 间 。 编 译 器 并 不 关心 类 成 员 的 顺序 , 你 想 以 什么 样 的 顺序 来 声明 它们 , 编 


译 器 都 能 接受 。 
Date::Date(int yy int mm, int dd) // constructor 
:y(YyY), m(mm), d(dd) j note: member initializers 


} 


void Date::add_day(int n) 
{ 

Ns 
} 


int month() //oops: we forgot Date:: 
{ 
return m; // not the member function, can’t access m 


} 
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符号 :y(yy) ,m(mm) ,d(dd) 就 是 类 成 员 初 始 化 的 语法 。 当 然 也 可 以 这 样 写 : 
Date::Date(int yy int mm, int dd) / constructor 
{ 
y= YYy; 
m= mm; 
d = dd; 
} 
但 后 一 种 写法 , 原则 上 讲 , 是 先 用 默认 值 对 成 员 进 行 了 初始 化 , 然后 又 对 它们 进行 了 赋值 。 而 且 
这 种 写法 的 一 个 潜在 问题 是 , 我 们 有 可 能 无 意 地 在 成 员 初 始 化 之 前 使 用 它们 。:y(yy) ,mkCmm) ,d 
(dd) 这 种 方式 更 直接 地 表达 了 我 们 的 意图 。 两 种 写法 之 间 的 区 别 与 下 面 两 段 代 码 之 间 的 区 别 是 
一 样 的 : 
int x; // first define the variable x 


1 ... 
X=2; // later assign to x 


和 


int x = 2; // define and immediately initialize with 2 


出 于 一 致 性 的 考虑 , 甚至 第 二 段 代 码 中 的 初始 化 语句 也 可 以 用 “参数 ”/ 括号 的 语法 来 表达 
int x(2); / initialize x with 2 
Date sunday(2004,8,29); /initialize sunday with (2004,8,29) 

我 们 也 可 以 直接 在 类 定义 中 定义 成 员 函 数 : 


// simple Date (some peopje prefer implementation details last) 
class Date { 


public: 
Date(int yy int mm, int dd) 
:yyyy mtmm), d(dd) 
{ 
1... 
} 


void add_day(int n): 
{ 
Ma 


} 
int month() { return m; } 


1/... 
private: 

inty, m, d; /year, month, day 
}; 


我 们 需要 注意 的 第 一 点 是 , 将 成 员 函 数 定义 放 在 类 定义 中 会 使 类 声明 变 得 大 而 “凌乱 ”。 例 如 在 此 
例 中 , 构造 函数 和 add_day( ) 的 代码 会 有 十 几 行 甚至 更 长 。 这 使 类 声明 的 规模 比 原来 增 大 几 倍 ， 
而 且 使 用 户 难以 在 实现 细节 中 找到 接口 。 因 此 , 我 们 不 会 在 类 声明 中 定义 大 的 函数 。 

但 是 , 看 一 下 month( ) 的 定义 , 它 比 放 在 类 声明 之 外 的 版 本 Date :: month( ) 要 更 为 直接 和 简 
短 。 对 于 这 种 简单 的 、 较 小 的 函数 ， 我 们 应 该 考虑 直接 在 类 声明 中 给 出 黄 定 义 。 

注意 , month( ) 可 以 访问 定义 在 其 后 (下 ) 面 的 m。 实 际 上 ， 类 成 员 对 其 他 成 员 的 访问 并 不 依 
赖 于 成 员 在 类 中 的 声明 位 置 。 本 书 前 文 介绍 的 “名 字 必 须 在 使 用 之 前 声明 ”这 一 规则 , 在 一 个 类 内 
的 有 限 作用 域 中 可 以 放宽 。 

将 成 员 函 数 的 定义 放 在 类 定义 内 有 两 个 作用 : 
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e。 天数 将 成 为 内 联 的 (inlined) ， 即 编译 器 为 此 函数 的 调用 生成 代码 时 , 不 会 生成 真正 的 函数 
调用 ,而 是 将 其 代码 戏 人 到 调用 者 的 代码 中 。 对 于 month( ) 这 种 所 做 工作 很 少 , 又 被 频繁 
调用 的 函数 ,这 种 编译 方式 会 带 来 很 大 的 性 能 提升 。 
。 每 当 我 们 对 内 联 晴 数 体 作出 修改 时 , 所 有 使 用 这 个 类 的 程序 都 不 得 不 重新 编译 。 如 果 函 
数 体位 于 类 声明 之 外 的 话 , 就 不 必 这 样 ， 只 在 类 接口 改变 时 才 需 要 重新 编译 用 户 程序 。 对 
于 大 程序 来 说 ,函数 体 改变 时 无 需 重 新 编译 程序 会 是 一 个 巨大 的 优势 。 
显然 , 我 们 应 遵循 如 下 基本 原则 : 除非 你 明确 需要 从 小 函数 的 内 联 中 获得 性 能 提升 ， 否 则 不 
要 将 成 员 函 数 体 放 在 类 声明 中 。 对 于 5 行 以 上 代码 的 陪 数 , 不 会 从 内 联 中 获 益 。 对 于 由 超过 一 两 
个 表达 式 组 成 的 函数 , 本 书 很 少 采 用 内 联 方式 。 
9.4.5 引用 当前 对 象 

考虑 如 下 使 用 Date 类 的 简单 代码 : 


class Date { 
hss 
int month() { return m; } 
h... 
private: 
inty m,d; //year, month, day 
}; 


void f(Date dt Date d2) 
{ 
cout << dt.month() << '' << d2.month({) << \n'; 


} 
Date :: month( ) 是 如 何 知道 第 一 次 被 调用 时 应 打印 dl. m, 第 二 次 被 调用 时 应 打印 i 呢 ? 再 看 
一 下 Date :: month( ) , 其 声明 指出 它 没 有 任何 参数 ! 那么 Date :: month( ) 是 怎么 知道 是 哪个 对 象 在 
调用 它 呢 ?9 奥妙 在 这 里 , 每 个 类 成 员 范 数 ( 如 Date :: month( ) ) 都 有 一 个 隐 式 参数 , 用 来 识别 调用 
它 的 对 象 。 因 此 , 在 第 一 次 调用 中 , m 会 正确 地 指向 dl. m, 而 在 第 二 次 调用 中 , 它 指向 d2. m。 参 
见 17. 10 节 , 获得 更 多 使 用 此 隐 式 参数 的 内 容 。 
9. 4.6 报告 错误 

当 我 们 发 现 一 个 无 效 日 期 时 , 应 该 做 什么 呢 ? 检查 无 效 日 期 的 代码 应 该 放 在 程序 中 什么 位 置 
呢 ? 从 5.6 节 我 们 可 以 得 到 第 一 个 问题 的 答案 :“ 抛 出 一 个 异常 ”， 而 放置 检查 代码 的 位 置 显然 应 
该 是 我 们 最 初 构造 一 个 Date 对 象 时 。 如 果 我 们 没有 创建 无 效 的 Date 对 象 , 而 且 成 员 函 数 也 编写 
正确 , 那么 我 们 就 永远 不 会 得 到 具有 无 效 值 的 Date 对 象 。 因 此 , 我 们 应 该 阻止 用 户 创 建 具 有 无 效 


状态 的 Date 对 象 。 
// simple Date (prevent invajid dates) 
class Date{ . 
public: 
. Class Invalid { }; // to be used as exception 


Date(int y, int m, int d); // check for valid date and initialize 
Ms 
private: 
int y, m, d; // year, month day 
bool check();  //return true if date is valid 
}; 


我 们 将 有 效 性 检查 代码 放 到 一 个 独立 的 函数 check( ) 中, 这 一 方面 是 因为 , 从 逻辑 上 讲 ， 有效 性 检 
查 与 初始 化 就 是 不 同 的 工作 , 另 一 方面 是 因为 ,我 们 可 能 需要 多 个 构造 函数 。 如 你 所 见 , 除了 私 
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有 数据 外 , 我 们 还 可 以 为 类 声明 私有 函数 : 
Date: :Date(int yy int mm, int dd) 
: yyy) mmm), d(dd) /initialize data members 


if (1check()) throw Invalid(); // check for validity 
} 


bool Date::check() // return true if date is valid 


if (m<1 || 12<m) return false; 
1... 
} 
给 出 这 样 的 Date 定义 后 , 我 们 可 以 写 出 如 下 代码 : 
void f(int x, int y) 
try { 
Date dxy(2004,x,y); 
cout << dxy << \n'; // see 59.8 for a declaration of << 
dxy.add_day(2); 
} 
catch(Date: :Invalid) { 
error("invalid date"); /error() defined in §5.6.3 
} 


我 们 现在 知道 ，<< 和 add_day( ) 会 获得 一 个 有 效 的 日 期 作为 它们 的 操作 对 象 。 
我 们 将 在 9.7 节 完 成 Date 类 的 演化 , 在 此 之 前 , 我 们 先 介绍 几 个 常用 的 语言 功能 , 我 们 需要 
这 些 功 能 来 更 好 地 完成 Date 类 的 演化 : 枚 举 类 型 和 运算 符 重 载 。 


9.5 枚 举 类 型 


枚 举 (enumeration, 简写 为 enum) 是 一 种 非常 简单 的 用 户 自 定义 类 型 , 它 指定 一 个 值 的 集合 ， 
这 些 值 用 符号 常量 表示 , 称 为 枚 举 量 (enumerator) 。 下 面 是 一 个 例子 : 


enum Month { 有 
jan=1, feb, mar, apr, may, jun, jul, aug, sep, oct, nov dec 


}» 
一 个 枚 举 定 义 的 “ 体 ” 就 是 一 个 简单 的 榴 举 量 列表 。 你 可 以 为 枚 举 量 指定 特定 的 值 , 就 像 上 面 代码 
为 jan 指定 值 一 样 。 也 可 以 不 指定 , 让 编译 器 选择 合适 的 值 。 如 果 你 让 编译 器 来 选择 值 ， 它 赋予 
每 个 枚 举 量 的 值 为 上 一 个 枚 举 量 的 值 加 上 1。 因 此 , 上 面 Month 的 定义 赋予 月 份 从 1 开始 的 连续 
整数 。 此 定义 与 下 面 的 定义 是 等 价 的 : 


enum Month { 
jan=1, feb=2, mar=3, apr=4, may=5, jun=6, 
jul=7, aug=8, sep=9, oct=10, nov=11, dec=12 
}; 


但 是 , 第 二 种 定义 一 方面 宛 长 乏味 , 另 一 方面 容易 出 错 。 实 际 上 , 我 们 在 输入 第 二 个 定义 时 出 现 
了 两 个 错误 , 经 过 修改 后 才 得 到 上 面 的 正确 版 本 。 因 此 , 最 好 还 是 让 编译 器 来 做 这 种 简单 的 、 重 
复 性 的 “机 械 的 ”工作 。 编 译 器 比 我 们 更 擅长 这 种 工作 , 而 且 它 不 会 厌烦 。 

如 果 我 们 不 初始 化 第 一 个 枚 举 量 , 那么 编译 器 会 从 0 开始 计数 。 例 如 : 


enum Day { 
monday, tuesday wednesday thursday friday, saturday sunday 
}; 


这 里 monday ==0, 而 sunday ==6。 在 实践 中 , 从 0 开始 往往 是 一 种 更 好 的 选择 。 
我 们 可 以 像 下 面 代码 那样 使 用 Month 
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Month m = feb; 

m=7; I error: can't assign an int to a Month 

int n = mi I OK: we can get the numeric value of a Month 
Month mm = Month( 刀 /convert int to Month (unchecked) 


注意 ,Month 是 一 个 独立 的 类 型 , 它 可 以 隐 式 转换 为 整 型 , 但 整 型 不 能 隐 式 转换 为 Month 类 型 。 这 
是 合理 的 ， 因 为 每 个 Month 值 都 对 应 一 个 相等 的 整 型 值 , 但 很 多 整 型 值 是 没有 相等 的 Month 值 的 。 
例如 , 我 们 肯定 希望 下 面 的 初始 化 失败 : 


Month bad = 9999; error can't convert an int to a Month 
如 果 你 非 要 坚持 使 用 Month(9999 ) 这 种 语法 , 那么 一 切 结果 得 由 你 自己 负责 ! 很 多 情况 下 ， 如 果 
程序 员 明 确 地 坚持 做 一 些 可 能 很 态 的 事情 , C++ 不 会 设法 阻止 , 毕竟 程序 员 可 能 更 清楚 自己 在 做 
什么 。 

遗憾 的 是 , 我 们 不 能 为 要 举 类 型 定义 一 个 构造 函数 来 检查 初始 值 , 但 编写 一 个 简单 的 检查 函 
数 还 是 很 容易 的 : 


Month int_to_month(int x) 
{ 


if (x<jan || dec<x) error("bad month"); 
return Month(x); 
下 
有 了 这 个 函数 , 我 们 就 可 以 这 样 来 检查 初始 值 了 : 

void flint m) 

{ 
Month mm = int_to_month(m); 
| 


) z 
我 们 能 用 枚 举 类 型 做 什么 呢 ? 原则 上 , 枚 举 类 型 可 以 用 于 任何 需要 一 组 相关 的 命名 整 型 常量 的 地 
方 。 当 我 们 想 表 示 选 项 (如 上 、 下 ; 是 、 否 也许; 开 、 关 ; 北 、 东北、 东 、 东南 、 南 、 西南 、 西 、 西 
北 等 ) 或 表示 不 同 值 (如 红 、 蓝 、 绿 、 黄 、 栗 、 深 红 、 黑 ) 时 ,就 属于 这 种 情况 。 

值得 注意 的 是 , 枚 举 量 的 作用 域 不 局 限 在 其 枚 举 类 型 内 , 而 是 与 其 枚 举 类 型 有 着 相同 的 作用 


域 。 例 如 ; 
enum Traffic_sign { red, yellow, green }; 
int var = red; I note: not Traffic_sign::red 


这 可 能 会 带 来 问题 。 如 果 你 为 全 局 名 字 起 了 一 些 很 短 而 且 常 用 的 名 字 , 如 red、on、ne 和 dec, 陨 
有 可 能 造成 混淆 。 例 如 ，ne 的 意思 是 “northeast” (东北 ) 还 是 “not equal” (不 等 )? dec 的 意思 是 
“decimal” (十 进 制 数 ) 还 是 “December” (十 二 月 )? 这 是 我 们 在 3.7 节 就 告诫 过 大 家 的 一 类 问题 ， 
如 果 我 们 定义 枚 举 类 型 时 使 用 了 一 些 短 的、 常用 的 名 字 , 而 其 作用 域 又 是 全 局 作用 域 的 话 , 就 很 
容易 遇 到 这 种 问题 。 实 际 上 ， 当 我 们 试图 同时 使 用 Month 和 iostream 时 ， 就 会 立刻 遇 到 这 种 名 字 
冲突 ,因为 iostream 中 有 一 个 名 为 dec 的 “操作 符 ”, 表示 “decimal” (参见 11.2. 1 节 )。 为 了 避免 这 
种 问题 , 我 们 通常 倾向 于 将 枚 举 类 型 定义 于 更 罕 的 作用 域 中 ,如 一 个 类 中 。 除 了 避免 名 字 冲 突 
外 , 这 还 使 枚 举 值 表示 的 含义 更 为 明确 , 如 Month :: jan 和 Color :: red。 我 们 将 在 9.7.1 节 中 介绍 
这 种 计数 。 如 果 确 实 需 要 全 局 名 字 , 我 们 会 通过 增加 名 字 长 度 、 使 用 不 常用 的 名 字 ( 或 不 常用 的 
拼写 方式 ) 以 及 使 用 大 小 写 等 方式 来 设法 降低 名 字 冲 突 的 机 会 。 然 而 , 我 们 的 首选 方案 还 是 在 合 
理 的 前 提 下 尽量 将 名 字 放 在 更 局 部 的 作用 域 中 。 


9.6 运算 符 重 载 
你 可 以 在 类 或 枚 举 对 象 上 定义 几乎 所 有 C++ 运算 符 , 这 通常 称 为 运算 符 重 载 (operator over- 
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loading) 。 这 种 机 制 用 于 为 用 户 自 定义 类 型 提供 习惯 的 符号 表示 方法 。 例 如 : 
enum Month { 
Jan=1, Feb, Mar, Apr, May, Jun, Jul, Aug, Sep, Oct Nov, Dec 
} 


Month operator++(Month& m) // prefix increment operator 
{ 

m = (m==Dec) ?jan : Month(m+1);  //“wrap around 

return m; 


} 
其 中 ?: 是 “算术 if” 运 算 符 : 当 (m == Dec) 时 m 的 值 变 为 Jan, 否则 m 的 值 为 Month( m +1)。 这 是 
十 二 月 后 “ 绕 回 " 一 月 这 一 事实 的 一 种 非常 简洁 的 描述 方法 。 我 们 可 以 像 如 下 代码 一 样 使 用 Month 


类 型 : 
Month m =Sep; 
十 十 Pn; lm becomes Oct 
+ 十 mn; lm becomes Nov 
++m; // m becomes Dec 
++im; Im becomes Jan (“wrap around”) 


你 可 能 觉得 增加 Month 对 象 值 这 样 的 操作 没 那 么 常用 , 不 至 于 设计 一 个 专门 的 运算 符 。 可 能 确实 
是 这 样 , 那么 输出 运算 符 又 如 何 呢 ? 如 下 代码 定义 了 一 个 输出 运算 符 ; 


vector<string> month_tbj; 


Ostream& operator<<(ostream& os, Month m) 
{ 


return os << month_tbl[m]， 


} 

这 里 假定 month_tbl 已 经 在 其 他 位 置 进行 了 初始 化 , 每 个 数组 元 素 保 存 了 对 应 月 份 的 恰当 的 名 字 ， 
如 month_[ Marj] 的 值 为 字符 串 “March”, 参见 10. 11.3 节 。 

你 可 以 为 自己 的 类 型 重新 定义 几乎 所 有 的 C++ 运算 符 , 如 +、-、*、/、%、[]、()、 
1!、&、<、<=、> 和 >= 等 。 你 不 能 定义 新 的 运算 符 , 你 可 能 想 在 程序 中 把 * * 或 $ = 作为 运 
算 符 ,但 C++ 不 允许 你 这 样 做 。 而 且 , 重 载运 算 符 时 ,运算 对 象 数 目 也 必须 与 原来 一 样 。 例 
如 , 你 可 以 定义 一 元 运算 符 -， 但 不 能 定义 一 元 的 <= (小 于 等 于 ) , 你 可 以 定义 二 元 运算 符 + ， 
但 不 能 定义 二 元 的 ! ( 非 )。 原 则 上 , C++ 允许 你 对 自 定义 类 型 使 用 已 有 的 语法 , 但 不 允许 扩 
展 语法 。 

一 个 重 载 的 运算 符 必须 作用 于 至 少 一 个 用 户 自 定义 类 型 的 运算 对 象 

int operator+(int,int); ”Werror': you can't overjoad built-in + 


Vector operator+(const Vector&, const Vector &); /OK 
. Vector operator+=(const Vector&, int); /OK 


一 个 一 般 性 的 原则 是 ; 除非 你 真正 确定 重 载运 算 符 能 大 大 改善 代码 , 否则 不 要 为 你 的 类 型 定义 运 
算 符 。 而 且 , 重 载 运算 符 应 该 保持 其 原 有 意义 : + 就 应 该 是 加 法 ,二 元 运算 符 * 就 应 该 表示 乘法 ， 
[ 表示 元 素 访 问 ,( ) 表 示 调 用 , 等 等 。 这 只 是 建议 , 并 不 是 C++ 语言 规则 , 但 这 是 一 个 有 益 的 建 
议 ; 按 习 惯 使 用 运算 符 , 例如 + 只 用 做 加 法 ,对 我 们 理解 程序 会 有 极 大 的 帮助 。 毕 况 , 这 种 习惯 
用 法 源 于 人 们 千 百 年 来 使 用 数学 符号 的 经 验 。 相 反 , 含混 不 清 的 运算 符 和 与 常规 不 符 的 使 用 方式 
是 混乱 和 错误 之 源 。 

注意 , 就 像 大 家 一 般 猜 想 的 那样 , 重 载 最 多 的 运算 符 是 + 、- 、* 、/, 而 不 是 =、==、! =、 
<、[j] 及 ()。 
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9.7 类 接口 


我 们 已 经 讨论 过 , 类 的 公有 接口 和 实现 部 分 应 应 该 分 离 。 只 要 为 那些 “旧式 简单 数据 ?类 型 保留 

着 struct 功能 , 不 同意 接口 和 实现 分 离 原则 的 专业 人 员 就 会 很 少 。 但 是 , 如 何 来 设计 一 个 好 的 接 
?好 的 公关 接口 和 前 相 的 接 吕 之 同 有 什么 区 器 和 个 问题 有 借助 实例 但 我 们 仍 

能 列 出 一 些 一 般 原 则 , 它们 在 C++ 中 都 有 支持 : 

e 保持 接口 的 完整 性 。 

。 保持 接口 的 最 小 化 。 

。 提供 构造 函数 。 

。 支持 (或 者 禁止 ) 找 贝 (参见 14.2.4 节 )。 

。 使 用 类 型 来 提供 完善 的 类 型 检查 。 

。 支持 不 可 修改 的 成 员 函 数 (参见 9.7.4 节 )。 

。 在 析 构 函数 中 释放 所 有 资源 (参见 17.5 节 ) 。 

参见 5.5 节 ( 如 何 检测 及 报告 运行 时 错误 )。 

前 两 条 原则 可 以 归结 为 “保持 接口 尽 可 能 小 , 但 不 要 更 小 了 ”。 我 们 希望 接口 尽量 小 , 是 因为 
小 的 接口 易于 学 习 和 记忆 , 而 实现 者 也 不 会 为 不 必要 的 和 很 少 使 用 的 功能 浪费 大 量 时 间 。 小 的 接 
口 还 意味 着 当 错 误 发 生 时 , 我 们 只 需 检 查 很 少 的 函数 来 定位 错误 。 平 均 来 看 , 公有 成 员 函 数 越 
公有 数据 的 类 是 非常 复杂 的 , 不 要 让 陷 和 其中。 当然, 前 提 
还 是 要 保证 完整 性 , 否则 接口 就 没有 用 处 了 。 如 果 一 个 接口 无 法 完成 我 们 真正 需要 做 的 全 部 工 
作 , 我 们 是 不 会 使 用 它 的 。 : 

下 面 我 们 讨论 其 他 一 些 话题 , 这些 话题 更 为 具体 ,直接 对 应 C++ 语 言 功能 。 
9.7. 1 参数 类 型 

当 我 们 在 9.4.3 节 中 为 Date 定义 构造 函数 时 , 使 用 了 三 个 整 型 作为 其 参数 。 这 会 带 来 一 
些 问题 ， 


Date d1(4,5,2005); /oops: year 4, day 2005 
Date d2(2005,4,5);  // April 5 or May 4? 


第 一 个 问题 (无 效 的 日 和 月 ) 比较 容易 处 理 , 在 构造 浮 数 中 进行 检测 即 可 。 但 是 ,第 二 个 问题 (月 
和 日 的 混 消 ), 通过 用 户 编写 的 检测 代码 是 无 法 查找 出 来 的 。 这 个 问题 是 由 于 人 们 书号 月 和 日 的 
习惯 不 同 而 造成 的 : 例如 , 475 在 美国 表示 4 月 5 日, 但 在 英国 表示 5 月 4 日。 我们 不 能 指望 不 遇 
到 这 个 问题 , 必须 采取 其 他 手段 解决 它 。 一 种 明显 的 解决 方案 是 使 用 类 型 系统 ， 


// simple Date (use Month type) 
class Date { 
public: 
enum Month { 
jan=1, feb, mar, apr, may, jun, jul, aug, sep, oct, nov, dec 





}; 
Date(int y, Month m, int d); // check for valid date and initialize 
Ms 


private: 
int y; /year 
Month m; 
int d; /day 
}; 
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如 果 像 上 面 代码 一 样 使 用 了 Month 类 型 ， 当 我 们 颠倒 了 月 和 日 这 两 个 参数 时 , 编译 器 就 会 捕获 这 
个 问题 。 而 且 , 使 用 一 个 枚 举 类 型 作为 月 的 类 型 , 令 我 们 可 以 使 用 符号 名 来 表示 月 份 , 这 样 的 代 
码 通常 比 直接 使 用 数字 更 易 读 ， 因 而 也 更 不 容易 出 错 : 


Date dx1(1998, 4, 3); - .Herror: 2nd argument not a Month 
Date dx2(1998, 4, Date::mar); /error: 2nd argument not a Month 
Date dx2(4, Date::mar, 1998);  // oops: run-time error day 1998 
Date dx2(Date::mar, 4, 1998);  // error: 2nd argument not a Month 

Date dx3(1998, Date: :mar, 30); /OK 


在 这 段 代 码 中 , 编译 器 帮 我 们 避免 了 很 多 “意外 ”。 注 意 代码 中 用 类 名 Date 来 限定 枚 举 量 mar 的 
部 分 : Date :: mar。 这 就 是 我 们 所 说 的 ,mar 是 Date 的 mar。 我 们 没有 用 Date. mar， 因 为 Date 不 是 
一 个 对 象 ( 而 是 一 个 类 型 ), 而 mar 也 不 是 一 个 数据 成 员 (而 是 一 个 枚 举 量 一 一 个 符号 常量 ) 。 
我 们 在 类 名 (或 名 字 空 间 名 , 参见 8.7 节 ) 后 使 用 :: , 而 在 对 象 名 后 使 用 . (点 )。 

如 果 可 以 选择 , 我 们 宁可 在 编译 时 将 错误 捕获 ,而 不 要 留 在 运行 时 。 我 们 更 希望 由 编译 器 找 
到 错误 , 而 不 是 由 我 们 自己 来 寻找 到 底 是 哪 部 分 代码 发 生 了 间 题 。 而 且 ， 如 果 错 误 可 以 在 编译 时 
被 捕获 , 我 们 就 不 需要 编写 检查 代码 , 最 终 程序 的 效率 也 就 会 更 高 。 

考虑 这 么 一 个 问题 : 我 们 能 捕获 颠倒 日 /月 与 年 的 情况 吗 ? 当然 是 可 以 的 , 但 是 解决 方案 不 
像 处 理 日 与 月 的 颠倒 那么 简单 、 优 美 。 毕 况 , 像 公元 4 年 这 样 的 年 份 也 是 有 效 的 , 我 们 的 方案 必 
须 能 表示 这 样 的 年 份 。 即 使 将 日 期 限定 为 近代 , 需要 表示 的 年 份 也 实在 是 太 多 了 , 无 法 定义 一 个 
枚 举 来 描述 所 有 这 些 年 份 。 

可 能 我 们 能 做 到 的 最 好 程度 (在 不 了 解 很 多 Date 用 途 的 情况 下 ) , 像 下 面 代码 这 样 : 


class Year { // year in Imin:max) range 
static const int min = 1800; 
static const int max = 2200; 
public: 
class Invalid { }; 
Year(int x) : y(x) {if (x<min || max<x) throw invalid(); } 
int year() { return y; } 
private: 
int y; 
}; 


class Date { 
pubjic: 
enum Month { 
jan=1, feb, mar, apr, may, jun, jul, aug, sep, oct, nov, dec 
}; 


Date(Yeary, Month m, intd); /check for valid date and initialize 
1... 


private: 

Year y; 

Month m; 

int d; lh day 
}; 


现在 ,我们 可 以 在 编译 时 避免 年 份 颠 倒 的 错误 了 : 


Date dx1(Year(1998), 4, 3); /error: 2nd argument not a Month 
Date dx2(Year(1998), 4, Date::mar); /error 2nd argument nota Month 
Date dx2(4, Date::mar, Year(1998));  // error: 1st argument not a Year 
Date dx2(Date: :mar, 4, Year(1998));  // error 2nd argument not a Month 
Date dx3(Year(1998), Date: :mar, 30); /OK 
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当然 ,下面 这 种 怪异 的 , 不 太 可 能 出 现 的 错误 , 编译 时 仍 无 法 捕获 : 


Date dx2(Year(4), Date: :mar, 1998);  // run-time error: Year::Invalid 
做 这 些 额 外 的 工作 、 引 入 这 些 新 的 符号 来 进行 年 份 的 检查 是 否 值得 呢 ? 这 自然 取决 于 你 用 Date 
解决 什么 问题 。 但 在 本 书 中 , 我 们 认为 没有 必要 这 人 么 做 , 因此 后 面 不 会 使 用 Year 类 。 

当 我 们 编程 时 , 应 该 一 直 问 自己 : 对 于 给 定 的 应 用 , 什么 是 足够 好 的 解决 方案 ? 我 们 通常 不 
会 奢侈 到 , 在 已 经 得 到 一 个 足够 好 的 方案 后 , 还 会 “无 止境 地 ”去 追求 最 佳 方 案 。 继 续 追 寻 下 去 的 
话 , 我 们 甚至 可 能 得 到 一 些 非常 复杂 , 但 却 比 最 初 的 简单 方案 更 差 的 方案 。 人 们 第 说 的 “至 羞 者 
善之 敌 "就 是 这 个 意思 。 

注意 min 和 max 定义 中 对 static const 的 使 用 。 这 就 是 我 们 在 类 中 定义 整 型 符号 常量 的 方法 。 
我 们 使 用 static 限定 一 个 类 成 员 , 可 以 保证 它 在 整个 程序 中 只 有 一 份 拷贝 ,而 不 是 每 个 类 对 象 都 
有 一 份 。 
9.7.2 拷贝 

编程 中 总 是 要 创建 对 象 的, 也 就 是 说 , 我 们 总 是 要 考虑 初始 化 和 构造 函数 。 构 造 函 数 可 能 是 
最 重要 的 类 成 员 : 为 了 编写 构造 函数 , 我 们 必须 确定 初始 化 一 个 对 象 时 应 该 做 什么 , 以 及 什么 样 
的 值 是 有 效 值 ( 什 么 是 不 变 式 )? 单纯 地 考虑 初始 化 工作 , 会 帮助 你 在 设计 构造 函数 时 避免 销 误 。 

下 一 个 经 常 要 考虑 的 问题 是 : 我 们 需要 拷贝 对 象 吗 ? 如 有 果 需 要 ,如 何 来 拷贝 呢 ? 

对 于 Date 或 Month, 答案 是 我 们 显然 需要 拷贝 这 两 种 类 型 的 对 象 ; 而 这 两 种 类 型 的 对 象 的 拷 
贝 的 含义 很 简单 一 一 只 要 复制 所 有 成 员 即 可 。 实 际 上 , 这 正 是 默认 情况 。 只 要 你 不 特别 声明 ，, 编 
译 器 就 会 正确 地 做 到 上 述 效果 。 例 如 ， 如 果 你 将 一 个 Month 对 象 作为 初始 化 值 和 赋值 运算 的 右 
部 ,编译 器 就 会 完成 其 所 有 成 员 的 拷贝 

Date holiday(1978, Date: :jul, 4); / initialization 


Date d2 = holiday; 
Date d3 = Date(1978, Date: :jul, 4); 


holiday = Date(1978, Date: :dec, 24); / assignment 
d3 = holiday; 


这 段 代 码 已 经 完全 按 我 们 的 期 望 工作 了 。 用 Date(1978 ，Date :: dec, 24) 可 以 创建 一 个 正确 的 未 命 
名 Date 对 象 , 你 可 以 用 它 来 做 一 些 适当 的 工作 。 例 如 : 


cout << Date(1978, Date: :dec, 24); 
这 里 对 构造 函数 的 使 用 ,从 字面 上 看 , 与 一 个 类 的 作用 非常 相近 。 通 常 ， 当 我 们 需要 定义 一 个 只 
使 用 一 次 的 变量 或 常量 时 , 这 是 一 种 很 方便 的 方法 。 

如 果 我 们 需要 拷贝 操作 的 含义 与 默认 情况 不 同 , 应 该 怎么 做 呢 ? 我 可 以 定义 目 己 的 拷贝 隆 数 
(参见 18.2 节 ), 或 者 把 拷贝 构造 函数 和 拷贝 赋值 运算 符 设置 为 私有 的 (参见 14. 2.4 市 )。 
9.7.3 软 认 构造 芳 数 

未 初始 化 的 变量 可 能 会 成 为 错误 之 源 。 为 了 解决 这 个 问题 , 我 们 可 以 用 构造 函数 来 保证 类 的 
每 个 对 象 都 被 初始 化 。 例 如 , 我 们 定义 了 构造 函数 Date :: Date (int，Month ,int) 来 保证 每 个 Date 
对 象 都 会 被 正确 地 初始 化 。 这 意味 着 程序 员 必 须 提供 三 个 类 型 正确 的 参数 。 例 如 : 


Date di1; /f error: no initializer 

Date d2(1998); // error: too few arguments 

Date d3(1,2,3,4); / error: too many arguments 

Date d4(1,"jan",2); // error: wrong argument type 

Date d5(1,Date::jan,2); // OK: use the three-argument constructor 
Date d6 = d5; // OK: use the copy constructor 


注意 , 虽然 我 们 为 Date 定义 了 一 个 需要 三 个 参数 的 构造 函数 , 但 是 通过 赋值 运算 直接 拷贝 还 是 没 
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有 问题 的 。 
很 多 类 都 能 很 好 地 理解 默认 值 ， 即 它们 能 解决 这 个 问题 :“ 如果 我 没有 为 对 象 提供 一 个 初始 
值 , 那么 它 应 该 具有 什么 值 ?” 例如: 


string s1; 1/ default value: the empty string ” 
vector<string> v1; // default value: the empty vector; no elements 
vector<string> v2(10);  // vector of 10 default strings 


这 些 代码 就 是 像 注释 所 描述 的 那样 工作 , 这 看 起 来 很 合理 。 之 所 以 vector 和 string 类 能 支持 这 样 
的 特性 ,是 因为 它们 都 有 默认 构造 函数 , 可 以 隐 含 地 进行 所 需 的 初始 化 工作 。 

对 于 类 型 了, 符号 T( ) 表 示 默 认 值 , 这 是 通过 定义 默认 构造 函数 实现 的 , 因此 , 我 们 可 以 写 出 
下 面 这样 的 代码 : 


string s1 = string(); // default value: the empty string "" 
vector<string> v1 = vector<string>0);  / default value: 

/the empty vector; no elements 
vector<string> v2(10,string()); lf vector of 10 default strings 


但 是 , 我 们 更 倾向 于 采用 下 面 这 种 等 价 的 和 更 “口语 化 ”的 语法 形式 : 
string s1; // default value: the empty string "" 
vector<string> v1; // default vaiue: the empty vector; no elements 
vector<string> v2(10);  // vector of 10 defauit strings 


对 于 内 置 类 型 , 如 int 和 double 来 说 , 默认 构造 函数 的 结果 为 0, 即 int( ) 是 0 的 一 种 复杂 描述 , 而 
double( ) 是 0.0 的 一 种 哪 嗪 的 说 法 。 
请 小 心 一 一 用 ( ) 语 法 进行 初始 化 存在 一 个 令 人 讨厌 的 问题 , 例如 ; 


string si("Ike™);  / string initialized to “Ike” 
string s2(); / function taking no argument returning a string 


使 用 默认 构造 函数 不 只 是 形式 上 的 问题 , 它 有 着 更 深层 次 的 重要 作用 。 设 想 一 下 , 我 们 可 能 会 得 
到 未 初始 化 的 string 或 vector 对 象 : 


string s; 
for (int i=0;i<s.size(); ++i) //oops: loop an undefined number of times 
toupper(s{i}); / oops: modify the contents of a random memory location 





vector<string> v; 
v.push._back("bad"); 1 oops: write to random address 


如 果 s 和 v 的 值 真 的 是 未 定义 , 我 们 就 完全 不 知道 它们 包含 多 少 个 元 素 或 者 无 法 (采用 一 些 常用 
的 实现 技术 , 参见 17.5 节 ) 知 道 这 些 元 素 存 放 在 哪里 。 其 结果 就 是 我 们 可 能 会 访问 随机 地 址 一 一 
这 会 叶 致 最 麻烦 的 一 类 错误 。 基 本 上 , 没有 构造 函数 , 我 们 就 无 法 建立 一 个 不 变 式 , 也 就 不 能 保 
”证 变量 中 的 值 是 有 效 的 (参见 9.4.3 节 )。 我 们 必须 坚持 对 变量 进行 初始 化 , 必须 坚持 使 用 初始 化 
程序 , 像 下 面 代码 这 样 : 


string s1 = ""; 
vector<string> v1(0); 
vector<string> v2(10,""); /vector of 10 empty strings 


但 是 , 这 种 方法 也 不 是 非常 完美 。 对 于 string 类 型 ,非常 显然 "" 是 表示 “ 空 字符 串 ”。 对 于 vector 
类 型 , 用 0 来 表示 “ 空 向 量 "也 不 会 引起 什么 混淆 。 然 而 , 对 于 很 多 类 型 来 说 , 找到 一 个 值 , 能 合 
理 地 表示 默认 值 并 不 那么 容易 。 因 此 , 更 好 的 方法 是 定义 一 个 构造 函数 , 不 需要 程序 员 显 式 提供 
初始 化 程序 就 能 创建 对 象 。 这 种 构造 函数 不 接受 参数 , 我 们 称 之 为 默认 构造 函数 。 

例如 , 对 于 日 期 来 说 , 就 不 存在 一 个 显然 的 默认 值 。 这 就 是 我 们 为 什么 到 目前 为 止 还 没有 为 
Date 定义 一 个 默认 构造 泪 数 的 原因 , 现在 我 们 为 它 定义 一 个 (只 是 说 明 我 们 可 以 这 样 做 而 已 ) : 
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class Date { 

public: 
hs 
Date(); /default constructor 
ht... 

private: 


int y; 
Month m; 
int d; 
上 
我 们 需要 挑选 一 个 默认 日 期 , 21 世纪 的 第 一 天 可 能 是 个 合理 的 选择 : 
Date::Datel() 
:y(2001), m(Date: :jan), d(1) 
{ 
} 


如 果 我 们 不 想 把 默认 值 写 人 构造 函数 的 代码 中 , 我 们 可 以 使 用 一 个 常量 (或 一 个 变量 )。 为 了 避免 
使 用 全 局 变量 带 来 的 初始 化 等 问题 , 我 们 使 用 8. 6. 2 节 中 介绍 的 技术 : 
Date& default_date() 
{ 
static Date dd(2001,Date: :jan,1); 
return dd; 
} 
这 里 使 用 了 static, 这 样 就 不 会 每 次 调用 default_date( ) 时 都 创建 变量 dd, 它 只 在 第 一 次 调用 de- 
fault_date( ) 时 被 创建 并 被 初始 化 。 有 了 default_date( ) 函数 ,为 Date 创建 一 个 默认 构造 画 数 就 很 
简单 了 : 
Date: :Date() 
:y(default_date().year()), 
m(default_date().month()), 
d(default_date().day()) 
{ 
} 


注意 , 默认 构造 函数 无 须 检查 对 象 值 , 因为 创建 默认 日 期 的 函数 已 经 做 过 了 。 有 了 Date 的 构造 函 
数 , 我 们 就 可 以 定义 Date 数组 了 : 

vector<Date> birthdays(10); 
如 果 没 有 上 默认 构造 函数 , 我 们 可 能 不 得 不 这 样 做 

vector<Date> birthdays(10,default_date()); 
9.7.4 const 成 员 函 数 

对 于 有 些 变量 , 我 们 希望 它们 可 以 被 改变 一 一 这 也 是 为 什么 我 们 称 之 为 “变量 "的 原因 。 但 对 
于 另外 一 些 变量 , 我 们 则 不 希望 改变 它们 ， 即 我 们 想 用 “变量 "表示 的 实际 上 是 不 变量 。 我 们 通常 
称 之 为 常量 (constant, 或 者 简写 为 const) 。 考 虑 下 面 代码 : 


void some_ function(Date& d, const Date& start_of_term) 


{ 
inta = d.day(); OK 
int b = start_of term.day(};  //should be OK (why?) 
d.add_day(3); lfine 
start_of term.add day(3); /error 
} 


在 这 里 , 我 们 希望 d 是 可 变 的 ，start_of_term 是 不 可 变 的 , 而 some_function( ) 将 不 被 允许 对 start_ 
of_term 进行 更 改 。 编 译 器 是 如 何 知 道 这 些 的 呢 ? 这 是 因为 我 们 将 start_of_term 定义 为 常量 的 , 从 
而 使 编译 器 获得 了 上 述 信息 。 好 了 ，, 我 们 达到 了 预期 的 目的 , 但 是 , 为 什么 用 day( ) 来 读 取 start. 
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of_term 的 成 员 day 是 被 允许 的 呢 ? 根据 前 面 给 出 的 Date 的 定义 ,因为 编译 器 不 知道 day( ) 是 否 修 
改 了 对 象 的 日 期 ，start_of_term. day( ) 应 该 是 错误 的 。 我 们 没有 给 出 过 这 方面 的 任何 信息 , 因此 编 
译 器 应 该 假定 day( ) 有 可 能 改变 日 期 , 它 应 该 报告 一 个 错误 。 

我 们 可 以 将 类 操作 划分 为 两 类 : 可 更 改 和 不 可 更 改 , 这 样 就 可 以 解决 这 个 问题 了 。 这 个 语言 
特性 对 于 我 们 深入 理解 类 是 非常 重要 的 , 而 且 它 也 具有 很 重要 的 实践 意义 ; 不 修改 对 象 的 操作 可 
以 在 常量 对 象 上 调用 , 例如 : 


class Date { 

public: 
ds 
int day() const; // const member can't modify the object 
Month month( const; // const member can’t modify the object 
int year() const; // const member: can't modify the object 


void add_day(int n); // non-const member: can modify the object 
void add_month(int mm) // non-const member: can modify the object 
void add_year(int n);  //non-const member: can modify the object 


private: 
int y; // year 
Month m; 
int d; /W day of month 


}; 


Date d(2000, Date: :jan, 20); 
const Date cd(2001, Date: :feb, 21); 


cout << d.day() << " — "<<cd.day() << endl; /OK 
d.add_day(1); // OK . 
cd.add day(1); //error: cd is a const 


在 一 个 成 员 消 数 声 明 中 , 我 们 将 const 放置 参数 列表 右边 , 就 表示 这 个 成 员 函 数 可 以 在 一 个 常量 对 
象 上 调用 。 一 旦 我 们 将 一 个 成 员 函 数 声明 为 常量 的 , 编译 器 会 帮助 我 们 保证 这 个 成 员 函 数 不 会 修 
改 对 象 。 例如 * 


int Date: :day() const 


++d;  //error: attempt to change object from const member function 
return d; 


} 
当然 , 我 们 不 会 经 常 像 上 面 代码 这 样 “ 欺 骗 " 编 译 器 。 但 我 们 可 能 会 无 意 中 这 么 做 , 特别 是 当代 码 
非常 复杂 时 , 而 编译 器 可 以 保证 避免 这 样 的 问题 。 
9. 7.5 类 成 员 和 "辅助 函数 ” 

当 我 们 试图 最 小 化 类 接口 时 (在 保证 完整 性 的 前 提 下 ) , 不 得 不 忽略 大 量 有 用 的 操作 。 如 果 一 
个 晒 数 可 以 简单 、 优 美 、 高 效 地 实现 为 一 个 独立 函数 时 ( 即 实现 为 非 成 员 函 数 ) ， 就 应 该 将 它 的 实 
现 放 在 类 外 。 和 采用 这 种 方式 ,函数 中 的 错误 就 不 会 直接 破坏 类 对 象 中 的 数据 。 不 访问 类 描述 是 很 
重要 的 ， 因 为 常用 的 debug 技术 是 “首先 排查 惯 犯 ， 即 当 类 出 现 问题 时 , 首先 检查 直接 访问 类 描 
述 的 函数 : 几乎 可 以 肯定 是 这 类 函数 导致 的 错误 。 如 果 这 类 函数 只 有 十 几 个 而 不 是 50 个 的 话 , 我 
们 当然 会 很 高 兴 。 

Date 类 有 50 个 成 员 函 数 ! 你 一 定 认为 我 们 是 在 开玩笑 。 但 我 们 没有 : 几 年 前 我 调查 了 一 些 商 
用 的 Date 库 , 发 现 这 些 库 中 充斥 着 像 next_Sunday( ) 、next_workday( ) 等 这 样 的 函数 。 对 于 一 个 设计 
目标 更 倾向 于 方便 用 户 使 用 , 而 不 是 易于 理解 、 实 现 和 维护 的 类 来 说 , 有 50 个 成 员 函 数 并 不 过 分 。 
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为 一 点 值得 注意 的 是 , 如 果 类 描述 改变 ， 只 有 直接 访问 描述 的 函数 才 需 要 重 写 。 这 是 保持 接口 
最 小 化 的 男 一 个 重要 原因 。 在 我 们 的 Date 例子 中 , 我 们 可 能 会 党 得 用 一 个 整数 表示 自 1900 年 1 月 1 
日 至 今 的 天 数 , 比 (年 , 月 , 日 ) 的 形式 好 得 多 。 如 果 做 出 这 样 的 改变 ， 只 需要 修改 成 员 函 数 。 

下 面 是 一 些 辅助 函数 (helper function ) 的 例子 : 

Date next_Sunday(const Date& d) 

// access d using d.day(), d.month(), and d.year() 


// make new Date to return 


} 
Date next_weekday(const Date& d) {/*...*/} 
bool leapyear(int y)} {/* ...*/} 


bool operator==(const Date& a const Date& b) 
{ 
return a.year()==b.year() 
&& a.month()==b.month() 
&& a.day()==b.day(); 
} 


booi operator!=(const Date& a, const Date& b) 

return !(a==b); 

} 
辅助 函数 也 有 便利 函数 (convenience function ) 、 帮 助 函数 (auxiliary function ) 等 很 多 名 字 。 这 类 也 
数 和 其 他 非 成 员 函 数 在 逻辑 上 是 有 区 别 的 一 一 辅助 函数 是 一 种 设计 思想 , 而 不 是 一 种 编程 概念 。 
辅助 函数 通常 接受 一 个 类 对 象 作 为 其 参数 , 它 就 是 为 这 个 类 做 辅助 工作 。 当 然 也 有 例外 : 注意 
leapyear( ) 。 我 们 通常 用 命名 空间 来 区 分 一 组 辅助 函数 , 参见 8.7 节 : 

namespace Chrono { 

class Date {/*...*/}; 

bool is_date(inty Date: :Month m, int d); // true for valid date 

Date next_Sunday(const Date& d) {/*...*/} 

Date next_weekday(const Date& d) {/*...*/} 

bool leapyear(int y) {/* ...*/} //see exercise 10 

bool operator==(const Date& a, const Date& b) {/*..."*/} 

下 
请 注意 == 和 ! = 函数 , 它们 是 典型 的 辅助 孔 数 。 对 于 很 多 类 来 说 ，== 和 ! = 具有 明显 的 意义 ， 
但 它们 又 并 不 是 对 所 有 类 都 有 意义 , 因此 编译 器 无 法 像 处 理 找 贝 构造 函数 和 赋值 运算 符 那 样 为 你 
定义 默认 的 == 和 ! = 中 数 。 

还 请 注意 我 们 引 人 了 一 个 辅助 函数 is_date( ) 。 这 个 函数 代替 了 Date :: check( ) ， 因 为 检查 一 
个 日 期 是 否 有 效 很 大 程度 上 与 日 期 的 描述 是 无 关 的 。 例 如 , 我 们 无 需 知 道 日 期 对 象 是 如 何 描述 
的 ， 就 可 以 判断 “2008 年 1 月 30 日 ?是 有 效 的 ,“2008 年 2 月 30 日 "是 无 效 的 。 还 有 一 些 日 期 相关 
的 问题 可 能 依赖 于 描述 方法 (例如 , 我 们 可 以 表示 “1066 年 1 月 30 日 " 吗 ), 但 这 可 以 由 Date 的 构 
造 晴 数 来 处 理 (如果 和 需要 的 话 )。 


9.8 Date 类 


现在 , 让 我 们 将 这 一 章 介绍 的 内 容 组 合 在 一 起 , 看 看 能 设计 出 什么 样 的 Date 类 来 。 下 面 代码 
中 函数 体 都 只 是 “…” 的 注释 , 因为 具体 实现 很 复杂 (请 不 要 现在 就 尝试 实现 它们 )。 首 先 , 我 们 将 
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声明 放 在 头 文件 Chrono. h 中 : 
j file Chrono.h 


namespace Chrono { 


class Date { 
public: 
enum Month { 
jan=1, feb, mar, apr, may, jun, jul, aug, sep, oct, nov, dec 


上 
class invalid {}; /to throw as exception 


Date(int y, Month m, int d); // check for valid date and initiajize 
Date(); 1/ default constructor 
// the default copy operations are fine 


I nonmodifying operations: 

int day() const { return d; } 

Month month() const { return m; } 
int year() const { return y; } 


/ modifying operations: 
void add_day(int n); 
void add_month(int n); 
void add_year(int n); 


private : 
int y; 
Month m; 
int d; 

}; 


bool is_date(int y, Date: :Month m, int d); // true forvaiid date 
boolleapyear(int y);  // true if y is aleap year 


bool operator==(const Date& a, const Date& b); 
bool operator!=(const Date& a, const Date& b); 


ostream& operator<<(ostream& os, const Date& d); 
istream& operator>>(istream& is, Date& dd); 


AN Chrono 


定义 在 Chrono. cpp 中 : 
/Chrono.cpp 


namespace Chrono { 
Amember function definitions: 


Date::Date(int yy Month mm, int dd) 
: Y(YY), mmm), d(dd) 


if (tis_date(yy,mm,dd)) throw Invalid(); 
Date& default_date() 
{ 


static Date dd(2001,Date::jan,1);  //start of 21st century 
return dd; 
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} 

Date::Date() 
:yY(default_date().year()), 
m(defauit_date()}.month()), 
d(default_date().day()) 

{ 

} 

void Date:: add_day(int n) 

{ 

/ow 

} 

void Date::add_month(int n) 

{ 

1... 

} 


void Date: :add_year(int n) 
if (m==feb && d==29 && lleapyear(y+n)) { /beware of leap years! 
m = mar; // use March 1 instead of February 29 
d=1; 


y+=n; 


} 


// helper functions: 
bool is_date(int y, Date: :Month m, int d) 
: // assume that y is valid 
if (d<=0) return false; Ad must be positive 
int days_in_month=31;  //most months have 31 days 


switch (m) { 


case Date: :feb: // the length of February varies 
days_in_month = (leapyear(y))?29:28; 
break; 


case Date::apr: case Date::jun: case Date::sep: case Date::nov: 
days_in month=30; /the rest have 30 days 
break; 


} 
if (days_in_month<d) return false; 


return true; 


} 
bool leapyear(int y) 


/ see exercise 10 


bool operator==(const Date& a, const Date& b) 
return a.year()==b.year'() 
&& a.month()==b.month() 
&& a,day()==b.day(); 
} 


bool operatori=(const Date& a const Date& b) 


return !(a==b); 


ostream& operator<<(ostream& os, const Date& d) 
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return 0s <<'( << d.year() 
<< <<d.month() 
<< 1 << d.day() << 人 小; 


} 
istreamg& operator>>(istreamg& is, Date& dd) 
{ 
inty m, d; 
char ch1, ch2, ch3, ch4; 
is >> ch1 >> y >> ch2 >> m >> ch3 >> d >> ch4; 
if (tis) return is; 
if (ch1!=':( || ch25= || ch31=",° || ch41=")") { // oops: format error 
is.clear(ios_base: :failbit); /set the faij bit 
return is; 
} 
return is; 
} 
enum Day { 
sunday, monday, tuesday, wednesday, thursday, friday, saturday 
}; 


Day day_of_week(const Date& d) 
{ 


/Ee 
} 


Date next_Sunday(const Date& d) 


{ 
h... 


} 


Date next_weekday(const Date& d) 


{ 
Ms 


} 


}H Chrono 
顶 数 >> 和 << 的 实现 将 在 10.7 节 和 10. 8 节 中 详细 解释 。 
<》 简 单 练习 
本 练习 的 目的 就 是 使 一 系列 Date 版 本 能 正常 工作 。 对 每 个 版 本 , 请 定义 一 个 名 为 today 的 Date 对 象 ， 
初 值 为 1978 年 6 月 25 日 。 然 后, 定义 一 个 名 为 tomorrow 的 Date 对 象 , 通过 拷贝 today 对 其 赋值 ,随后 使 用 
add_day( ) 将 其 向 后 推移 一 天 。 最 后 , 使 用 9. 8 节 中 定义 的 << 输 出 today 和 tomorrow。 
有 效 日 期 的 检查 可 以 简单 实现 。 但 应 保证 不 接受 [1, 12] 范 围 之 外 的 月 份 和 [1, 31] 范 围 之 外 的 日 期 。 
对 每 个 版 本 至 少 用 一 个 无 效 日 期 来 测试 (如 2004 年 13 月 -5 日 )。 
1. 9.4. 1 节 中 的 版 本 。 
2. 9.4.2 节 中 的 版 本 。 
3. 9.4.3 节 中 的 版 本 。 
4. 9.7.1 节 中 的 版 本 。 
5. 9.7.4 节 中 的 版 本 。 


》 思 考古 
1. 本 章 中 所 找 述 的 类 的 两 个 组 成 部 分 是 什么 ? 
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: 在 一 个 类 中 , 定义 和 实现 的 区 别 是 什么 ? 

. 本 章 中 最 初 定义 的 Date 结构 有 什么 局 限 和 问题 ? 

. 为 什么 要 为 Date 类 型 定义 构造 函数 来 取代 函数 init_day( )? 

: 什么 是 不 变 式 ?给 出 一 个 例子 。 

.什么 时 候 应 该 将 函数 定义 置 于 类 定义 内 ? 什么 时 候 又 应 该 置 于 类 外 ? 为 什么 ? 

.在 程序 中 什么 时 候 应 该 使 用 运算 符 重 载 ? 给 出 一 个 你 可 能 想 重 载 的 运算 符 列表 (对 于 每 一 个 请 给 出 一 个 
原因 ) 。 

8. 为 什么 应 该 令 一 个 类 的 公有 接口 尽量 小 ? 

9， 为 一 个 成 员 函 数 加 上 const 限定 符 有 什么 作用 ? 

10. 为 什么 辅助 函数 最 好 放 在 类 定义 之 外 ? 


<] Lh ko 


<》 术语 
内 置 类 型 枚 举 不 变 式 class 枚 举 量 描述 
const 辅助 函数 struct 构造 画 数 ”实现 结构 
析 构 明 数 内 联 用 户 自 定义 类 型 enum 接口 有 效 状态 
2 


1. 对 9.1 节 中 介绍 的 真实 世界 中 的 对 象 ( 如 烤 面 包机 ) 列 出 可 能 的 操作 。 

2. 设计 并 实现 一 个 保存 (name，age) 对 的 Name_pairs 类 , 其 中 name 是 一 个 string, age 是 一 个 double。 将 值 对 
描述 为 一 个 名 为 name 的 vector < string > 成 员 和 一 个 名 为 age 的 vector < double > 成 员 。 提 供 一 个 输 和 人 操作 
read_names( ) ， 能 读 人 一 个 名 字 列 表 。 提 供 一 个 read_ages( ) 操作 , 提示 用 户 为 每 个 名 字 输 入 一 个 年 龄 。 
提供 一 个 print( ) 操作 , 按 name 向 量 的 顺序 打印 (name[i] ，age[i] ) 对 (每 行 一 个 值 对 ) 。 提 供 一 个 sort( ) 
操作 , 将 name 向 量 按 字 典 序 排序 , 并 相应 地 重 排 age 向 量 使 之 与 name 向 量 的 新 顺序 相 匹 配 。 将 所 有 “ 操 
作 " 实 现 为 成 员 函 数 。 测 试 这 个 类 ( 当然 , 在 设计 过 程 中 尽早 测试 并 多 测试 ) 。 

3. 将 Name_pairs :: print( ) 函数 替换 为 (全 局 ) 运 算 符 <<，, 并 为 Name_pair 定义 == 和 ! = 运算 符 。 

4. 考察 8.4 节 最 后 那个 令 人 头痛 的 例子 。 给 它 加 上 适当 的 缩 进 和 解释 每 个 语法 结构 意义 的 注释 。 注 意 , 这 
个 例子 并 未 做 任何 有 意义 的 事情 , 它 只 是 单纯 地 为 了 说 明令 人 困惑 的 代码 风格 。 

5. 此 题 和 接 下 来 的 几 道 题 要 求 你 设计 并 实现 一 个 Book 类 , 你 可 以 设想 这 是 图 书馆 软件 系统 的 一 部 分 。Book 
类 应 包含 表示 ISBN 号 、 书 名 、 作 者 和 版 权 日 期 以 及 表示 是 否 已 经 倩 出 的 成 员 。 创 建 能 返回 这 些 成 员 的 值 
的 函数 ， 以 及 借 书 和 还 书 的 函数 。 对 于 输 人 Book 对 象 的 数据 进行 简单 的 有 效 性 检查 , 例如， 只 接受 n-n- 
n-x 形式 的 ISBN 号 , 其 中 n 是 一 个 整数 , x 是 一 个 数字 或 一 个 字母 。 

6. 为 Book 类 添加 运算 符 。 添 加 == 运算 符 , 用 于 检查 两 本 书 的 ISBN 号 是 否 相 等 。 定 义 ! = 运算 符 , 比较 
ISBN 号 是 否 不 等 。 定 义 <<，, 分 行 输出 书 名 、 作者 和 ISBN 号 。 

7， 为 Book 类 创建 一 个 名 为 Genre 的 枚 举 类 型 ,用 以 区 分 书籍 的 类 型 : 小 说 (fiction) 、 非 小 说 类 文学 作品 
(nonfiction)、 期 刊 (periodiecal) 、 传 记 (biography) 、 儿 童 读物 (children)。 为 每 本 书 赋予 一 个 Genre 值 , 适 
当 修 改 Book 的 构造 函数 和 成 员 函 数 。 

8. 为 图 书馆 创建 一 个 Patron 类 , 包含 读者 姓名 、 图 书证 号 及 傅 阅 费 ( 如 果 欠 费 的 话 ) 。 创 建 访问 这 些 成 员 的 
盟 数 和 设 定 借 书 费 的 函数 。 定 义 一 个 辅助 函数 , 返回 一 个 布尔 值 , 表示 读者 是 否 欠 费 。 

9. 创建 一 个 Library 类 , 包含 一 个 Book 向 量 和 一 个 Patron 向 量 。 定 义 一 个 名 为 Transaction 的 struct, 包含 一 
个 Book 对 象 、 一 个 Patron 对 象 和 一 个 本 章 中 定义 的 Date 对 象 , 表示 借阅 记录 。 在 Library 类 中 定义 一 个 
Transaction 向 量 。 定 义 向 图 书馆 添加 图 书 、 添 加 读者 以 及 借 出 书籍 的 函数 。 当 一 个 读者 借 出 一 本 书 时 ， 
保证 Library 对 象 中 有 此 读者 和 这 本 书 的 记录 , 否则 报告 错误 。 然 后 检查 读者 是 否 从 费 , 如 果 从 费 就 报告 
一 个 错误 , 否则 创建 一 个 Transaction 对 象 , 将 其 放 人 Transaction 向 量 中 。 定 义 一 个 返回 包含 所 有 欠 费 读 
者 姓名 的 回 量 的 函数 。 

10. 实现 9.8 节 中 的 leapyear( ) 。 

11， 为 Date 类 设计 并 实现 一 组 辅助 画 数 ,如 next_workday( 假定 除 周 六 和 周 日 外 都 是 工作 日 ) 和 week_of year 
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14. 


15. 


(假定 第 1 周 是 1 月 1 日 所 在 那 周 , 每 周 的 第 1 天 是 周 日 )。 


. 改变 Date 类 的 描述 , 用 1970 年 1 月 1 日 (第 0 天 ) 至 今 的 天 数 表示 日 期 , 用 一 个 long 型 成 员 保 存 此 天 数 ， 


重新 实现 9.8 节 中 的 函数 。 保 证 拒绝 用 这 种 方法 无 法 表示 的 日 期 (第 0 天 之 前 的 日 期 也 拒绝 ， 即 不 允许 
负数 天 数 ) 。 es 


. 设计 并 实现 一 个 有 理 数 类 Rational。 一 个 有 理 数 由 两 部 分 组 成 : 分 子 和 分 母 , 如 5/6( 六 分 之 五 或 近似 为 


0. 83333 ) 。 如 果 需 要 的 话 , 请 查找 有 理 数 的 定义 。 为 Rational 类 定义 实现 赋值 、 加 、 减 、 乘 、 除 及 相等 判 
定 的 运算 符 ， 并 定义 转换 至 double 型 值 的 函数 。 为 什么 人 们 需要 使 用 Rational 类 ? 

设计 并 实现 一 个 Money 类 ,能 进行 包含 美元 和 美 分 、 精 确 到 美 分 的 计算 , 使 用 四 舍 五 人 规则 (大 于 等 于 
0. 5 美 分 人 , 小 于 0.5 美 分 舍 ) 。 用 一 个 long 型 成 员 以 美 分 值 表示 金额 , 但 输入 /输出 采用 美元 和 美 分 的 
形式 , 如 $ 123.45。 不 必 考 虑 金额 值 超出 long 型 范围 的 情况 。 

改进 Money 类 ,加 和 人 货币 功能 (货币 类 型 通过 构造 函数 参数 给 出 ) 。 能 接受 浮 点 型 的 初 值 ， 只 要 能 用 long 


”型 准确 表示 即 可 。 不 允许 非法 操作 ,如 Money * Money 这 种 无 意义 的 操作 , 但 只 要 你 提供 了 美元 (USD ) 


16. 
17. 


和 丹麦 克朗 (DKK) 之 间 的 汇率 就 可 以 支持 USD1. 23 + DKK5. 00 这 种 有 意义 的 操作 。 
给 出 一 个 例子 , 使 用 Rational 进行 计算 得 到 的 结果 比 使 用 Money 更 好 。 
给 出 一 个 例子 , 使 用 Rational 进行 计算 得 到 的 结果 比 使 用 double 类 型 更 好 。 


人 》 附 言 


用 户 自 定义 类 型 是 非常 多 的 , 比 本 章 所 介绍 的 多 得 多 。 用 户 自 定义 类 型 , 特别 是 类 , 是 C++ 的 核心 , 是 


很 多 高 效 设计 技术 的 关键 。 在 本 书 剩余 部 分 中 , 大 部 分 内 容 都 是 关于 类 的 设计 和 使 用 的 。 一 个 类 或 者 一 组 
类 , 是 我 们 用 来 在 代码 中 表达 思想 的 机 制 。 本 章 主要 介绍 了 类 的 语言 技术 细节 ,本 书 其 他 部 分 则 关注 如 何 
用 类 优美 地 表达 有 用 的 思想 。 
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6 学 习 科学 可 以 使 我 们 远 离 愚昧 。 





Richard P. Feynman 


在 本 章 和 第 11 章 中 , 我 们 将 从 多 个 角度 来 学 习 C++ 标准 库 中 有 关 处 理 输入 /输出 的 特性 : 输 
和 人 /输出 流 (IO stream) 。 我 们 将 展示 如 何 读 写 文件 , 如 何 处 理 输入 /输出 错误 , 如 何 进行 格式 化 
输入 , 以 及 如 何 为 用 户 自 定义 类 型 提供 输入 /输出 操作 符 及 如 何 使 用 这 类 操作 符 。 本 章 重点 介绍 
基本 问题 : 如 何 读 写 单个 值 , 以 及 如 何 打开 、 读 、 写 整个 文件 。 最 后 会 用 一 个 例子 来 说 明 在 一 个 
较 大 规模 的 程序 中 应 该 考虑 的 与 VO 相关 的 一 些 问题 。 第 11 章 将 会 介绍 更 深入 的 技术 细节 。 


10. 1 输入 和 输出 


如 果 没 有 数据 , 计算 就 毫 无 意义 。 我 们 需要 将 数据 输入 到 程序 中 来 进行 一 些 有 价值 的 计算 ， 
并 将 结果 从 中 程序 中 取出 。 在 4. 1 节 中 我 们 曾经 提 及 , 数据 的 输入 源 和 输出 目标 非常 广泛 。 如 果 
我 们 不 加 小 心 , 就 会 写 出 只 能 从 特定 的 源 输 入 数据 , 只 能 将 结果 输出 到 特定 设备 的 程序 。 这 对 于 
某 些 特定 应 用 ,比如 数码 相机 或 引擎 燃料 喷射 器 传感器 来 说 , 是 可 以 接受 的 (有 时 甚至 是 必需 
的 ) 。 但 对 于 大 多 数 应 用 , 我 们 需要 某 种 方法 将 程序 的 读 写 操作 与 实际 进行 输入/ 输出 的 设备 分 离 
开 。 如 果 我 们 必须 直接 访问 每 种 设备 , 那么 当 有 新 的 显示 器 或 磁盘 产品 面市 时 , 我 们 就 必须 修改 
程序 , 或 者 将 用 户 局 限于 程序 所 文 持 的 设备 , 这 是 很 东 诬 的 。 

大 多 数 现代 操作 系统 都 将 VO 设备 的 处 理 细节 放 在 设备 驱动 程序 中 , 通过 一 个 VO 库 访问 设 
备 驱 动 程序 , 这 就 使 不 同 设备 源 的 输入 /输出 尽 可 能 地 相似 。 一 般 地 , 设备 驱动 程序 都 位 于 操作 
系统 较 深 的 层次 中 , 大 多 数 用 户 是 看 不 到 它们 的 。LO 库 给 出 了 输入 /输出 的 一 个 抽象 , 从 而 程序 
员 不 必 关 心 具 体 的 设备 和 设备 驱动 程序 : 

数据 源 ; 


a 


数据 目的 地 : 


rT 
和 | 
Le 妈 基 下 er 
ee 
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如 果 操 作 系统 使 用 这 样 一 个 模型 ,， 则 所 有 输入 和 输出 可 以 看 做 字 节 (字符 ) 流 , 由 输入 /输出 库 处 
理 。 于 是 , 我 们 程序 员 的 工作 就 变 为 

1) 创建 指向 恰当 数据 源 和 数据 目的 地 的 10 流 。 

2) 读 和 写 这 些 流 。 
数据 在 程序 和 设备 间 实 际 是 如 何 传输 的 这 类 细节 , 都 是 由 /0 库 和 驱动 程序 来 处 理 的 。 在 本 章 和 
第 11 章 中 , 我 们 将 介绍 如 何 使 用 C++ 标准 库 来 格式 化 VO 流 中 的 数据 。 

从 程序 员 的 角度 , 输入 和 输出 可 以 分 为 多 种 不 同类 型 , 如 下 所 示 : 

。 大 量 数据 项 构成 的 流 ( 这 类 流通 常 对 应 文件 、 网 络 连 接 、 录 音 设备 或 显示 设备 ) 。 

。 通过 键盘 来 与 用 户 交互 的 流 。 : 

。 通过 图 形 界面 与 用 户 交互 的 流 ( 输 出 对 象 、 接 收 鼠 标点 击 事件 等 )。 
此 分 类 法 并 不 是 唯一 可 能 的 分 类 , 而且 在 这 种 分 类 中 , 三 类 IO 流 的 划分 不 是 那么 清晰 。 例 如 ， 
如 果 一 个 输出 字符 流 是 一 个 以 浏览 器 为 目的 地 的 HTTP 文档 , 那么 它 看 起 来 更 像 一 个 用 户 交互 
流 , 而 且 它 可 以 包含 图 形 元 素 。 反 过 来 , 与 GUI( 用 户 图 形 界面 ) 交 互 的 流 也 可 能 以 一 个 字符 序列 
的 形式 呈现 给 程序 。 这 种 分 类 法 虽然 不 完美 , 但 它 很 适合 我 们 的 工具 : 前 两 类 1O 可 以 用 C++ 标 
准 库 中 的 0 流 实现 , 而 且 大 多 数 操作 系统 都 直接 支持 这 两 类 IO。 从 第 1 章 开 始 , 我 们 就 已 经 
使 用 iostream 库 了 , 在 本 章 和 第 11 章 中 , 我 们 仍 主要 关注 这 方面 的 内 容 。 图 形 化 输出 和 图 形 化 用 
户 交互 则 由 其 他 一 些 库 支持 , 我 们 将 在 第 12 章 至 第 16 章 中 讨论 这 部 分 内 容 。 


10. 2 1/O 流 模 型 


C++ 标 准 库 提供 了 两 个 数据 类 型 ，istream 用 于 处 理 输 入 流 ，ostream 用 于 处 理 输 出 流 。 我 们 
已 经 使 用 过 标准 输入 流 cin 和 标准 输出 流 cout， 因此 我 们 已 经 了 解 了 应 该 如 何 使 用 标准 库 中 的 这 
部 分 特性 (通常 称 之 为 iostream 库 ) 。 

一 个 ostream 实现 

。 将 不 同类 型 的 值 转换 为 字符 序列 。 

。 将 这 些 字符 发 送 到 “ 某 处 ”( 如 控制 台 、 文件 、 主 存 或 者 另外 一 台 计 算 机 )。 
我 们 可 以 用 下 图 来 表示 ostream: . 


不 同类 型 的 值 字符 序列 





你 提交 给 ostream 的 数据 被 保存 在 buffer 数据 结构 中 , 通过 它 与 操作 系统 通信 。 你 可 能 会 发 现 ， 当 
你 将 数据 写 入 ostream, 可 能 一 段 “ 延迟" 之 后 字符 才 出 现在 目的 设备 , 这 通常 是 因为 字符 还 在 缓冲 
区 之 中 。 缓 冲 技术 是 提高 性 能 的 重要 技术 , 而 处 理 大 量 数据 时 性 能 是 很 重要 的 。 

一 个 istream 实现 

。 将 字符 序列 转换 为 不 同类 型 的 值 。 

。 从 某 处 (如 控制 台 、 文 件 、 主 存 或 另外 一 台 计 算 机 ) 获取 字符 。 
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一 个 istream 可 用 下 图 描述 : 


字符 序列 





与 ostream 一 样 ，istream 也 使 用 一 个 缓冲 区 来 与 操作 系统 通信 。istream 的 缓冲 区 很 多 情况 下 对 用 
户 是 可 见 的 。 当 你 使 用 一 个 与 键盘 相关 联 的 istream 时 , 你 所 键入 的 内 容 都 留 在 缓冲 区 中 ,直至 你 
敲 回 车 键 为 止 ( 回 车 /换行 ), 你 可 以 使 用 清除 键 ( 退 格 ) 来 “改变 你 的 主意 ”( 直至 敲 回 车 键 为 止 ) 。 

输出 的 一 个 主要 目的 就 是 生成 人 类 可 读 的 数据 形式 。 考 虑 email 消息 、 学 术 论 文 、 网 页 、 账 单 
记录 、 商 务 报告 、 通 讯 录 、 目录 、 设备 状态 信息 等 实例 , 因此 , ostream 提供 了 很 多 特性 , 用 于 格式 
化 文本 以 适应 不 同 需 求 。 同 样 为 了 易于 人 类 阅读 , 很 多 输入 数据 也 是 由 人 类 编写 或 者 格式 化 过 了 
的 。 因此 , istream 提供 了 一 些 特性 ， 用 于 读 取 由 ostream 生成 的 输出 内 容 。 我 们 将 在 11.2 节 介 绍 
格式 化 输入 /输出 , 在 11. 3.2 节 中 介绍 如 何 读 取 非 字 符 型 输入 数据 。 输 入 的 复杂 性 很 大 程度 在 于 
错误 处 理 。 为 了 能 给 出 更 为 实际 的 例子 , 我 们 将 从 数据 文件 相关 的 iostream 模型 开始 。 


10.3 文件 


通常 ,我 们 需要 处 理 的 数据 会 多 得 难以 放 人 计算 机 的 内 存 之 中 , 因此 我 们 将 大 部 分 数据 存放 
于 磁盘 或 其 他 大 容量 存储 设备 中 。 这 种 设备 还 具有 另外 一 个 我 们 需要 的 特性 : 断 电 后 , 保存 在 其 
中 的 数据 不 会 丢失 一 一 即 数据 是 持久 的 。 在 最 基本 的 层面 上 , 一 个 文件 可 以 简单 地 看 做 一 个 从 0 
开始 编号 的 字 节 序列 : 





通常 每 个 文件 都 有 自己 的 格式 , 即 有 一 组 规则 来 确定 其 中 字 节 的 含义 。 例 如 ， 如 果 是 一 个 文本 文 
件 , 前 4 个 字 节 就 是 文本 的 前 4 个 字符 。 如 果 是 一 个 二 进 制 表示 的 整数 文件 , 同样 是 前 4 个 字 节 ， 
表示 的 就 是 第 1 个 整数 了 (参见 11. 3.2 节 )。 格 式 之 于 磁盘 文件 的 作用 , 与 类 型 之 于 内 存 对 象 的 
作用 是 一 样 的 。 当 ( 且 仅 当 ) 我 们 知道 一 个 文件 的 格式 (参见 11.2 ~ 11.3 节 ),， 我 们 就 能 弄 清文 件 
中 比特 流 的 意思 了 。 

对 于 一 个 文件 , ostream 将 内 存 中 的 对 象 转换 为 字 节 流 ， 再 将 字 节 流 写 到 磁盘 上 。istream 进行 
相反 的 操作 , 即 它 从 磁盘 获取 字 节 流 , 将 其 转换 为 对 象 : 





文件 iostream 对 象 
( 字 节 序列 ) ( 不 同类 型 ) 


多 数 情况 下 , 我 们 假定 这 些 “ 磁 盘 上 的 字 节 "都 是 常用 字符 集中 的 字符 。 这 个 假设 并 不 总 是 成 立 ， 
但 绝 大 多 数 情 况 下 我 们 可 以 认为 它 是 对 的 , 而 且 , 其 他 的 字符 集 表示 方式 也 是 不 难处 理 的 。 我 们 
还 假定 所 有 文件 都 保存 在 磁盘 上 ( 即 保存 在 旋转 磁 存 储 设备 上 ) 。 当 然 , 这 个 假设 也 不 总 是 成 立 
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(考虑 闪存 设备 ) , 但 在 这 个 层面 上 , 实际 采用 什么 存储 设备 对 程序 设计 来 说 没什么 区 别 , 这 也 是 
文件 和 流 抽象 层 的 好 处 之 一 。 

为 了 读 取 一 个 文件 , 我 们 需要 

1) 知道 文件 名 

2)《〈 以 读 模 式 ) 打开 文件 

3) 读 出 字符 

4) 关闭 文件 (虽然 通常 文件 会 被 隐 式 地 关闭 ) 

为 了 写 一 个 文件 , 我 们 需要 

1) 知道 文件 名 或 者 为 新 文件 命名 

2) (以 写 模式 ) 打 开 文 件 或 创建 一 个 新 文件 

3) 写 人 我 们 的 对 象 

4) 关闭 文件 (虽然 通常 文件 会 被 隐 式 地 关闭 ) 
实际 上 我 们 之 前 已 经 掌握 了 基本 的 文件 读 写 方法 了 , 因为 关联 到 一 个 文件 的 ostream 对 象 的 使 用 
方式 与 cout 是 完全 一 样 的 ， istream 对 象 则 与 cin 完全 一 样 ， 而 对 于 cin 和 cout, 我 们 已 经 很 熟悉 
了 。 我 们 将 在 11. 3. 3 节 中 介绍 一 些 只 用 于 文件 的 操作 。 但 现在 , 我 们 还 是 先 了 解 如 何 打 开 文 件 ， 
接 下 来 关注 那些 可 以 用 于 所 有 ostream 和 instream 对 象 的 操作 和 技术 。 


10. 4 打开 文件 


如 果 你 要 读 或 写 一 个 文件 ， 你 需要 打开 一 个 与 文件 相关 联 的 流 。ifstream 是 用 于 文件 的 is- 
tream 流 ( 读 取 文 件 )，ofstream 是 用 于 文件 的 ostream 的 流 ( 写 文件 ) ，fstream 是 用 于 文件 的 
iostream， 既 可 以 写 又 可 以 读 。 文 件 流 必须 与 某 个 文件 相关 联 , 然后 才 可 使 用 。 例 如 : 


cout << "Please enter input file name: "; 

string name; 

cin >> name; 

ifstream ist(name,c_str());  H istis an input stream for the file named name 
if (list) error("can't open input file ",name); 


定义 一 个 ifstream 对 和 象 时 , 如 果 给 出 一 个 字符 串 作 为 参数 , 则 以 读 模 式 打开 以 此 为 名 的 文件 , 并 将 
它 与 ifstream 对 象 相 关联 。 函 数 c_str( ) 是 string 类 的 一 个 成 员 函 数 , 将 string 对 象 转换 为 更 为 低层 
的 C 风格 字符 串 。 许 多 系统 接口 函数 的 参数 都 要 求 这 种 类 型 的 字符 串 。 ”1 ist" 用 来 检测 文件 是 否 
正常 打开 了 。 如 果 已 经 成 功 打 开 , 随后 我 们 就 可 以 像 读 取 其 他 任何 istream 对 象 一 样 从 文件 中 读 
取 数 据 了 。 例 如 , 假定 已 经 对 Point 类 定义 了 输入 操作 符 >>， 我 们 可 以 像 下 面 代码 这 样 从 文件 中 
读 取 Point 对 象 ; 


vector<Point> points; 
Point p; 
while (ist>>p) points.push_back(p); 


与 读 文件 的 过 程 类 似 , 写 文件 也 是 通过 流 来 实现 的 , 例如 : 


cout << "Please enter name of output file: "; 

string oname; 

cin >> oname; 

ofstream ost(oname.c_str(0)); // ost is an output stream for a file named name 
if (1ost) error("can't open output file ",oname); 


用 一 个 字符 趾 参 数 定义 一 个 ofstream 对 象 , 会 打开 以 该 字符 串 为 名 的 文件 与 流 对 象 相关 联 。 
“1ost" 检 测 文件 是 否 成 功 打开 。 如 果 成 功 打开 ,我 们 就 可 以 像 处 理 其 他 ostream 对 象 一 样 向 文件 
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中 写 人 数据 了 , 例如 : 
for (int i=0; i<points.size(); ++i) 
ost << (<< points[il.x << ，， << points[i].y << ")n"; 
当 程 序 离开 文件 流 对 象 的 作用 域 时 , 对 象 会 被 销毁 , 它 所 关联 的 文件 也 会 被 关闭 。 当 文件 被 关闭 
时 , 它 关 联 的 缓冲 区 会 被 刷新 , 即 缓冲 区 中 的 字符 会 被 写 回 文件 。 
一 般 来 说 , 我 们 最 好 在 较 早 的 时 间 , 在 任何 重要 的 计算 都 尚未 开始 之 前 就 打开 文件 。 毕 竟 ， 
如 果 我 们 在 完成 计算 之 后 才 发 现 无 法 保存 结果 , 将 会 是 对 计算 资源 的 巨大 浪费 。 
在 创建 ostream 或 istream 对 象 时 隐 式 打开 文件 , 并 依靠 流 对 象 的 作用 域 来 处 理 文件 关闭 , 这 
是 一 个 理想 的 方法 。 例 如 : 
void fill_from_file(vector<Point>& points, string& name) 
{ 
ifstream ist(name.c_str());  //open file for reading 
if (list) error("can't open input file ",name); 
1 ,use ist, ， 
// the file is implicitly closed when we leave the function 


} 
你 也 可 以 通过 open( ) 和 close( ) 操 作 显 式 打开 和 关闭 文件 (参见 附录 B. 7. 1) 。 但 是 , 依靠 作用 域 的 方 
式 最 大 限度 地 降低 了 两 类 错误 出 现 的 概率 : 在 打开 文件 之 前 或 关 团 之 后 使 用 文件 流 对 象 。 例 如 


ifstream ifs; 

,A 

ifs >> foo; 1 won't succeed: no file opened for ifs 
上 

ifs.open(name,ios_base::in); /opentfile named name for reading 
, 

ifs.close(); I close file 

ifs >> bar; I won't succeed: ifs' file was closed 


a 
在 真实 的 程序 中 , 通常 这 类 错误 更 难以 定位 。 幸 运 的 是 , 如 果 尚 未 关闭 一 个 文件 就 第 二 次 打开 
它 , open( ) 会 返回 一 个 错误 , 因此 这 种 错误 很 容易 发 现 。 例 如 : 


fstream fs; 

fs.open("foo", ios_base:; ;in) ; Wopen for input 

I/ closel) missing 

fs.open("foo", ios_base::out); I won't succeed: ifs is already open 
if (lfs) error("impossible"); 


因此 , 在 打开 一 个 文件 之 后 , 一 定 不 要 忘记 检测 是 否 成 功 了 。 

那么 我 们 为 什么 还 要 用 显 式 的 open( ) 和 close( ) 呢 ?是 这 样 的 , 我 们 偶尔 会 遇 到 这 样 一 种 情 
况 一 一 使 用 文件 的 范围 不 能 简单 包含 于 任何 流 对 象 的 作用 域 中 , 此 时 我 们 就 不 得 不 使 用 显 式 
open( ) 和 close( ) 了 。 但 这 种 情况 实在 是 太 少 见 了 , 因此 我 们 不 必 为 此 担心 。 更 确切 地 说 ， 
iostream( 以 及 C++ 标准 库 的 其 他 部 分 ) 都 使 用 作用 域 的 编程 风格 ， 只 有 在 不 使 用 这 种 风格 的 代码 
中 才能 找到 上 述 情况 。 

在 第 11 章 中 我 们 会 看 到 , 与 文件 相关 的 话题 还 有 很 多 , 但 现在 我 们 只 要 了 解 它们 作为 数据 源 
和 数据 目的 地 的 使 用 方法 就 足够 了 。 如 果 我 们 假定 用 户 必 须 直 接 键入 所 有 输入 数据 的 话 , 这 样 写 
出 的 程序 会 非常 不 实用 。 而 使 用 文件 , 你 在 调试 过 程 中 就 可 以 反复 从 文件 读 取 输 入 。 从 程序 员 的 
角度 来 看 , 这 也 是 文件 的 一 个 很 大 的 优点 。 


10.5 读 写 文件 
思考 这 样 一 个 问题 : 你 如 何 从 一 个 文件 中 读 取 一 些 实验 结果 , 并 将 其 描述 为 内 存 数据 对 象 ? 
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这 些 实验 结果 可 能 是 从 气象 站 获取 的 温度 数据 : 
0 60.7 
1 60.6 
2 60.3 
3 59.22 


这 个 数据 文件 包含 了 一 个 (小 时 , 温度 ) 数值 对 的 序列 。 小 时 的 值 从 0 到 23, 温度 为 华氏 度 值 。 没 
有 更 多 的 格式 ， 即 这 个 文件 不 包含 任何 特殊 的 头 信息 (例如 温度 读数 是 从 何 获取 的 )、 值 的 单位 、 
标点 (例如 在 每 个 值 对 外 加 上 括号 ) 或 者 终止 符 。 这 是 一 个 最 为 简单 的 情形 。 

我 们 可 以 用 一 个 Reading 类 型 来 描述 温度 读数 : 


struct Reading { // a temperature reading 
int hour; / hour after midnight [0:23] 
double temperature; /in Fahrenheit 
Reading(int h, double 0 :hour(h), temperature(t) {} 

六 

有 了 这 样 一 个 类 型 , 我 们 就 可 以 读 取 温 度 读数 了 : 

vector<Reading> temps; /store the readings here 

int hour; 

double temperature; . 

while (ist >> hour >> temperature) { 
if (hour <0| 23 <hour) error("hour out of range"); 
temps.push_back(Reading(hourn,temperature)); 


这 是 一 个 典型 的 输入 循环 。 正 如 前 面 介绍 的 ，istream 流 ist 可 以 是 一 个 输入 文件 流 (ifstream) ， 也 
可 以 是 标准 输入 流 cin( 的 一 个 别名 ) , 或 者 是 任何 其 他 类 型 的 istream。 对 于 这 段 代码 而 言 ， 它 并 
不 关心 这 个 istream 到 底 是 从 哪里 获取 数据 的 。 我 们 的 程序 所 关心 的 只 是 : ist 是 一 个 istream 而 且 
数据 格式 如 我 们 所 期 望 的 。 下 一 节 我 们 将 讨论 一 个 有 趣 的 问题 : 如 何在 输入 数据 中 检测 错误 ， 以 
及 发 现 格式 错误 后 我 们 应 该 如 何 做 。 

写 文件 通常 比 读 文 件 要 简单 。 再 重复 一 遍 , 一 旦 一 个 流 对 象 已 经 被 初始 化 , 我 们 不 必 了 解 它 
到 底 是 哪 种 类 型 的 流 。 特 别 地 , 对 于 上 一 节 介 绍 的 输出 文件 流 (ofstream) , 我 们 可 以 像 使 用 其 他 任 
何 ostream 一 样 来 使 用 它 。 例 如 , 我 们 可 能 想 输出 带 括号 的 温度 读数 数值 对 : 


for (int ji=0; i<temps.size(); ++i) 
ost<< "(<< temps[il.hour << ',' << tempsiil.temperature << ")n'"; 


最 终 的 程序 就 可 以 读 取 原始 的 温度 读数 文件 , 然后 利用 上 面 的 代码 创建 一 个 新 文件 , 其 中 每 个 数 
值 对 的 格式 为 (小 时 , 温度 ) 。 
由 于 文件 流 对 象 在 离开 其 作用 域 时 会 自动 关闭 所 关联 的 文件 , 因此 完整 的 程序 如 下 所 示 : 


#include "std._lib_facilities.h" 


struct Reading { /a temperature reading 
int hour; 1 hour after midnight {0:23] 
double temperature; /in Fahrenheit 
Reading(int h, doubie {) :hour(h), temperature(t) {} 
}; 


int main() 


cout << "Please enter input file name: "; 

string name; 

cin >> name; 

ifstream ist(name.c_str0); /istreads from the file named “name” 
if (!ist) error("can’t open input file ",name); 
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cout << "Please enter name of output file: "; 

cin >> name; 

ofstream ost(name.c_str()); /ost writes to a file named “name” 
if (!ost) error("can't open output file ",name); 


vector<Reading> temps; // store the readings here 
int hour; 
double temperature; 
while (ist >> hour >> temperature) { 
if(hour<0123 <hour) error("hour out of range"); 
temps.push_back(Reading(hour,temperature)); 


for (int i=0; i<temps.size(); ++i) 
ost << '( << temps[li}.hour << ',' 
<< temps[li}.temperature << )\n"; 


} 


10.6 1/O 绒 误 处 理 


当 处 理 输入 时 , 我 们 必须 预计 到 其 中 可 能 发 生 的 错误 并 给 出 相应 的 处 理 措施 。 输 入 中 会 发 生 


什么 类 型 的 错误 呢 ? 应 该 如 何 处 理 呢 ? 输入 错误 可 能 是 由 于 人 的 失误 (错误 理解 了 指令 、 打 字 错 
误 、 人 允许 自家 的 小 猫 在 键盘 上 散步 等 )、 文 件 格式 与 规范 不 符 、 我 们 (程序 员 ) 错误 估计 了 情况 等 
原因 造成 的 。 发 生 输 入 错误 的 可 能 情况 是 无 限 的 ! 但 istream 将 所 有 可 能 的 情况 归结 为 4 类, 称 为 


流 状 态 (stream state ) : 


流 状 态 

good( ) 操作 成 功 - 

eof( ) 到 达 输 入 末尾 (“文件 尾 ”) 
fail( ) 发 生 某 些 意外 情况 

bad( ) 发 生 严重 的 意外 


不 幸 的 是 , fail( ) 和 bad( ) 之 间 的 区 别 并 未 准确 定义 ,定义 新 类 型 VO 操作 的 ) 程 序 员 对 其 的 观点 
各 种 各 样 。 但 是 , 基本 的 思想 很 简单 : 如 果 输 入 操作 直到 一 个 简单 的 类 型 错误 , 则 使 流 进入 fail( ) 


， 也 就 是 假定 你 (输入 操作 的 用 户 ) 可 以 从 错误 中 恢复 。 男 一 方面 , 如 果 错 误 真 的 非常 严重 ， 


比如 发 生 了 磁盘 读 故 障 , 就 应 该 让 流 进入 bad( ) 状 态 , 也 就 是 假定 面 对 这 种 情况 你 所 能 做 的 很 有 


限 ， 


只 能 退出 输入 。 这 种 观点 导致 如 下 逻辑 : 


int i = 0; 
cin >> ij; 
if (lcin) { // we get here (only) if an input operation failed 
if (cin.bad()) error("cin is bad’); // stream corrupted: iets get out of herel 
if (cin.eof()) { 
lI no more input 
// this is often how we want a Sequence of input operations to end 


} 

if (cin.fail)) { // stream encountered something unexpected 
cin.clear(); / make ready for more input 
// somehow recover 

} 


} 


1cin 可 以 读 作 ”cin 不 成 功 ” 或 者 “cin 发 生 了 某 些 错 误 " 或 者 “cin 的 状态 不 是 good( )”, 这 与 “操作 
成 功 正好 相反 。 请 注意 我 们 在 处 理 fail( ) 时 所 使 用 的 cin. clear( ) , 当 流 发 生 错误 时 , 我 们 可 以 进 
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行 错 误 恢 复 , 为 了 恢复 错误 , 我 们 显 式 地 将 流 从 fail( ) 状态 转移 到 其 他 状态 , 从 而 可 以 继续 从 中 读 
取 字 符 。clear( ) 就 起 到 这 样 的 作用 一 一 调用 clear( ) 后, 流 的 状态 就 变 为 good( ) 。 

下 面 是 一 个 如 何 使 用 流 状 态 的 例子 。 假 定 我 们 要 读 取 一 个 整数 序列 存 入 一 个 vector 中 , 字符 
“* "或 “文件 尾 ”( 在 Windows 平台 是 字符 Ct +Z,，UNIX 平台 是 Ctrl + D) 表 示 序 列 结 束 。 例 如 : 


12345* 
上 述 功能 可 通过 如 下 了 消 数 来 实现 : 
void fill_vector(istreame& ist, vector<int>& v, char terminator) 
// read integers from ist into v unti| we reach eof() or terminator 





{ 
inti=0; 
while (ist >> i) v.push_back(i); 
if (ist.eof()) return; /fine: we found the end of file 


if (ist.bad()) error("istis bad"); /stream corrupted; iet's get out of herel 
if (ist.fail()) { / clean up the mess as best we can and report the problem 
ist.clear(); // clear stream state, 
/so that we can look for terminator 
char c; 
ist>>c; / read a character, hopefully terminator 
if (c != terminator) { // unexpected character 
ist.unget(); // put that character back 
ist.clear(ios_base: :failbit); /set the state to fail{) 


} 

} 
注意 , 即使 没有 过 到 终结 符 ， 函数 也 会 返回 。 毕 竟 , 我 们 可 能 已 经 读 取 了 一 些 数据 , 而 fil_vector( ) 
的 调用 者 也 许 有 能 力 从 fail( ) 状 态 中 恢复 过 来 。 由 于 我 们 已 经 调用 了 clear( ) 来 清除 状态 , 以便 检 
查 后 续 字 符 , 因此 , 为 了 让 调用 者 来 处 理 fail( ) 状态 , 我 们 必须 将 流 状态 重新 置 为 fail( ) 。 我 们 通 
过 调用 ist clear( ios_base :: failbit) 来 达到 这 一 目的 。 对 照 简单 的 clear( ) ， 带 参数 的 用 法 有 些 令 人 
迷惑 : 当 clear( ) 调 用 带 参 数 时 , 参数 中 所 指出 的 iostream 状态 位 会 被 置 位 (进入 相应 状态 ) ， 而 未 
指出 的 状态 位 会 被 复位 。 通 过 将 流 状态 设置 为 fail( ) ， 表 明 遇 到 了 一 个 格式 错误 ， 而 不 是 一 个 更 
为 严重 的 问题 。 我 们 用 unget( ) 将 字符 放 回 ist，fill _vector( ) 的 调用 者 可 能 需要 使 用 此 字符 。 
unget( ) 函数 是 putback( ) 的 简洁 版 , 它 依赖 流 对 象 记 住 最 后 一 个 字符 是 什么 , 从 而 不 需要 在 参数 
中 明确 给 出 。 

如 果 fijl_vector( ) 的 调用 者 希望 知道 是 什么 原因 终止 了 输入 , 可 以 检测 流 是 处 于 fail( ) 还 是 
eof( ) 状态 。 当 然 也 可 以 捕获 error( ) 抛 出 的 runtime_error 异常 , 但 当 istream 处 于 bad( ) 状 态 时 ， 继 
续 获 取 数 据 是 不 可 能 的 , 因此 大 多 数 调 用 者 不 必 为 此 烦恼 。 这 意味 着 ,几乎 在 所 有 情况 下 ,对 于 
bad( ) 状 态 , 我 们 所 能 做 的 只 是 抛 出 一 个 异常 。 简单 起 见 , 可 以 让 istream 帮 我 们 来 做 。 


1 make ist throw if it goes bad 
ist.exceptions(ist.exceptions()Jios_base: :badbit); 


语法 看 起 来 有 些 奇 怪 , 但 结果 很 简单 ， 当 此 语句 执行 时 ,如 果 ist 处 于 bad( ) 状 态 , 它 会 抛 出 一 个 
标准 库 异常 ios_base :: failure。 在 一 个 程序 中 , 我 们 只 能 调用 此 exceptions( ) 一 次 。 这 允许 我 们 简 
化 所 有 的 输入 过 程 , 忽略 对 bad( ) 的 处 理 : 


void fill_vector(istream& ist, vector<int>& v char terminator) 

// read integers from ist into v until we reach eof() or terminator 
{ 

inti = 0; 

while (ist >> i) v.push_back(i); 

让 (ist.eofO) return; /fine: we found the end of file 
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// not good0 and not bad() and not eof0, ist must be fail() 
ist.clear(); /WN clear stream state 


char c; 

ist>>c; // read a character, hopefully terminator 

if (c 1= terminator) { /ouch: not the terminator, so we must fail 
ist.unget(); /I maybe my caller can use that character 


ist.clear(ios_base: :failbit);  // set the state to fail() 
} 
} 


这 里 使 用 了 ios_base, 它 是 iostream 的 一 部 分 , 包含 常量 (如 badbit 的 定义 )、 异 常 (如 failure 的 年 
义 ) 以 及 其 他 一 些 有 用 的 定义 。 你 可 以 通过 :: 操作 符 来 使 用 它们 , 例如 ios_base :: badbit( 参见 附 
录 B.7.2)。 我 们 不 想 如 此 深入 地 讨论 iostream 库 的 细节 , 要 学 习 iostream 的 所 有 内 容 , 可 能 需要 
一 门 完整 的 课程 。 例 如 ,iostream 可 以 处 理 不 同 的 字符 集 , 实现 不 同 的 缓冲 策略 , 还 包含 一 些 工 
具 , 能 按 不 同 语言 的 习惯 格式 化 货币 金额 的 输入 /输出 一 一 我 们 曾经 收 到 过 一 份 错 误 报 告 , 是 关 
于 乌克兰 货币 输入 /输出 格式 的 。 如 果 需 要 的 话 , 可 以 参考 Stroustmp 的 《The C++ Programming 
Language》 和 Langer 的 《Standard C ++ IOStreams and Locales》 来 钻研 你 想 了 解 的 iostream 库 的 内 容 。 

与 istream 一 样 ,ostream 也 有 4 个 状态 : good( )、fail( )、eof( ) 和 bad()。 不 过 , 对 于 本 书 中 的 
程序 来 说 , 输出 错误 要 比 输入 错误 罕见 得 多 , 因此 我 能 通常 不 对 ostream 进行 状态 检测 。 如 果 程 序 
运行 环境 中 输出 设备 不 可 用 、 队 列 满 或 者 发 生 故 障 的 概率 很 高 ,我 们 就 可 以 像 处 理 输入 操作 那 
样 , 在 每 次 输出 操作 之 后 都 检测 状态 


10. 7 读 取 单个 值 


现在 , 我 们 已 经 知道 如 何 读 取 以 文件 尾 或 者 某 个 特定 终结 符 结束 的 值 序列 了 。 我 们 还 会 学 习 

一 些 更 为 复杂 的 例子 , 但 在 此 之 前 ， 先 看 一 个 非常 常见 的 应 用 模式 : 不 断 要 求 用 户 输入 一 个 值 ， 
直至 用 户 输入 的 值 合乎 要 求 为 止 。 你 可 以 从 这 个 例子 中 学 到 几 种 常见 的 设计 策略 , 我 们 通过 “如 
何 从 用 户 获取 一 个 合乎 要 求 的 值 ” 这 个 问题 的 几 种 可 选 的 解决 方案 来 展示 这 些 设计 策略 。 我 们 从 
一 个 不 那么 令 人 满意 的 “初步 尝试 "方案 开始 , 逐步 提出 改进 方案 , 基本 假设 是 : 我 们 是 在 处 理 交 
互 式 的 输入 一 一 程序 给 出 提示 信息 , 用 户 键 信 数据。 假定 要 求 用 户 输入 一 个 1 到 10 之 间 ( 包 含 1 


和 10) 的 整数 : 
cout << "Please enter an integer in the range 1 to 10 (inclusive):\n"; 
intn = 0; 
while (cin>>n) { /read 


if (1<=n && n<=10) break;  //check range 
cout<< “Sorry ” 
<<n <<" isnotin the [1:10] range; please try againNn "; 
} 


这 段 代码 确实 很 丑陋 , 但 它 在 某 种 程度 上 是 可 以 正常 工作 的 。 如 果 你 不 喜欢 使 用 break (参见 附录 
A.6), 可 以 将 读 操作 和 范围 检查 合并 为 一 条 语句 : 


cout << "Please enter an integer in the range 1 to 10 (inclusive):\n"; 
intn = 0; 
while (cin>>n && !(1<=n && n<=10)) /read and check range 
cout << "Sorry ” 
<<n <<" isnotin the [1:10] range; please try againn"; 


这 不 过 是 简单 的 改头换面 , 并 未 改变 代码 实质 。 为 什么 说 这 段 代 码 只 是 “在 某 种 程度 上 正常 工作 ” 
呢 ? 原因 在 于 , 这 段 代 码 只 有 在 用 户 小 心地 输入 整数 的 情况 下 才 正 常 工作 。 如 果 用 户 键盘 输入 很 
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不 熟练 , 本 想 输 入 6, 但 输入 了 ft 在 大 多 数 键盘 上 , t 恰 好 在 6 的 上 面 ) , 程序 会 不 改变 n 的 值 就 退 
出 循环 , 于 是 n 中 的 值 就 不 在 要 求 范围 之 内 。 这 样 的 代码 是 不 能 被 称 为 高 质量 代码 的 。 而 且 , 爱 
开玩笑 的 人 (或 者 是 勤奋 的 测试 人 员 ) 还 有 可 能 从 键盘 键入 “文件 尾 ” 符 号 (在 Windows 平台 是 
Ctrl +Z, 在 UNIX 平台 是 Ctrl +D)。 于 是 , 再 次 出 现 循环 结束 后 n 不 在 合法 范围 的 情况 。 换 句 话 
说 , 为 了 获得 可 靠 的 输入 , 我 们 必须 处 理 3 个 问题 : 

1) 用 户 输入 超出 范围 的 值 。 

2) 没有 输入 任何 值 (键入 文件 尾 符号 ) 。 

3) 用 户 输入 的 内 容 类 型 错误 (在 本 例 中 , 未 输入 整数 ) 。 
我 们 想 要 如 何 应 对 这 些 问题 呢 ? 这 也 是 程序 设计 过 程 中 常常 会 遇 到 的 问题 : 我 们 真正 想 要 的 是 什 
么 ? 在 这 里 , 对 于 每 个 错误 , 我 们 有 3 种 可 选 的 应 对 方式 : 

1) 在 负责 输入 的 代码 中 处 理 错 误 。 

2) 抛 出 一 个 异常 , 让 其 他 代码 来 处 理 这 个 错误 (有 可 能 终止 程序 )。 

3) 忽略 这 个 错误 。 
巧合 的 是 , 这 恰恰 是 三 种 最 为 常用 的 错误 处 理 策略 , 因此 本 例 是 展示 如 何 处 理 错 误 的 很 好 的 例子 。 

人 们 很 容易 说 , 第 三 种 策略 ( 即 忽略 错误 的 方式 ) 是 不 可 接受 的 , 但 这 样 说 有 点 过 于 居高临下 
了 。 如 果 我 是 在 编写 一 个 自己 用 的 简单 程序 , 还 是 可 以 随意 选择 实现 策略 的 , 包括 “忘记 ”进行 错 
误 检 测 , 不 去 管 那些 可 能 带 来 严重 问题 的 计算 结果 。 但 是 ,如 果 是 在 编写 一 个 将 来 可 能 长 时 间 运 
行 的 程序 , 忽略 这 些 错误 就 很 恩 长 了。 如 果 程 序 可 能 被 他 人 所 用 的 话 ， 就 更 加 不 能 在 程序 中 忽略 
对 这 类 错误 的 检测 了 。 请 注意 , 这 里 我 有 意识 地 使 用 了 “我 ”而 不 是 “我 们 ”, 因为 “我 们 ”可 能 会 
导致 误解 。 也 就 是 说 , 我 们 的 观点 是 ,如 果 超 过 两 个 人 使 用 程序 的 话 , 第 三 种 策略 是 不 能 接受 的 ， 
但 对 于 个 人 编写 程序 个 人 使 用 的 情况 , 就 不 必 那 么 绝对 了 。 

在 第 一 和 第 二 种 策略 间 进 行 取舍 是 很 困难 的 。 对 于 某 个 给 定 程 序 , 可 能 有 很 好 的 理由 选择 两 
种 策略 中 的 任何 一 个 。 首 先 注 意 , 在 大 多 数 程序 中 , 对 于 用 户 不 通过 键盘 进行 输入 的 情况 , 还 没 
有 一 种 简洁 的 、 局 部 性 的 方法 来 处 理 。 因 为 当 输 入 流 关闭 后 , 没有 什么 好 的 办 法 来 请 求 用 户 输入 
一 个 数 。 我 们 当然 可 以 重新 打开 cin( 使 用 cin. clear( ) ) , 但 用 户 很 可 能 不 是 意外 地 关闭 输入 流 的 。 
(你 会 意外 地 敲 Ctrl +2Z 键 吗 ?) 如果 一 个 程序 希望 读 取 一 个 整数 , 但 却 遇 到 一 个 “文件 尾 ”, 负责 读 
人 整数 的 代码 最 好 放弃 努力 , 寄 希 望 于 程序 的 其 他 部 分 能 处 理 这 个 问题 , 也 就 是 说 , 读 取 输入 的 
代码 应 该 抛 出 一 个 异常 。 这 意味 着 我 们 本 质 上 并 不 是 要 选择 是 抛 出 异常 或 是 就 地 处 理 错 误 , 而 是 
要 选择 哪些 错误 我 们 应 该 就 地 处 理 。 
10. 7.1 将 程序 分 解 为 易 管理 的 子 模块 

下 面 我 们 尝试 既 处 理 超 出 范围 的 输入 , 又 处 理 类 型 错误 的 输入 : 


cout << "Please enter an integer in the range 1 to 10 (inclusive):\n"; 
intn =0; 
while (true) { 
Cin >> n; 
if (cin) { // we got an integer; now check it 
if (1<=n && n<=10) break; 
cout<< "Sorry" - 
<<n<<" isnotin the {1:10] range; please try again\n"; 


else if (cin.fail()) { // we found something that wasn't an integer 
cin.clear(); // set the state back to good(); 
/we want to look at the characters 
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cout << "Sorry, that was not a number; please try again ne 
char ch; 
while (cin>>ch && lisdigit(ch)) ; /throw away non-digits 
if (1cin) error("no input”); /we didn't find a digit: give up 
cin.unget(); // put the digit back, so that we can read the number 
} 
else { 
error("no input"); /eof or bad: give up 
} 
} 
I if we get here n is in [1:10] 
这 段 代 码 又 乱 又 元 长 。 它 是 如 此 之 乱 , 以 至 于 当 有 人 需要 编写 让 用 户 输入 整数 的 程序 时 , 我 们 绝 
不 会 建议 他 们 这 样 写 。 但 另 一 方面 , 我 们 确实 要 在 代码 中 处理 潜在 的 错误 , 因为 用 户 确 实时 时 在 
制造 错误 , 我 们 该 怎么 办 呢 ? 这 段 程 序 如 此 之 乱 , 是 因为 它 把 处 理 好 几 件 不 同事 情 的 代码 都 混合 
在 一 起 了 : 
。 读 取 数值 
e 提示 用 户 输入 数值 
。 输出 错误 信息 
e 跳 过 “问题 字符 ” 
e 测试 输入 是 否 在 所 需 范围 内 
一 种 常用 的 令 代 码 更 为 清晰 的 方法 是 将 逻辑 上 做 不 同事 情 的 代码 划分 为 独立 的 函数 。 例 如 ,对 于 
发 现 “ 问 题字 符 ”( 如 意料 之 外 的 字符 ) 后 进行 错误 恢复 的 代码 , 我 们 就 可 以 将 其 分 离 出 来 : 


void skip_to_int() 


if (cin.fail()) { 1 we found something that wasn't an integer 
cin.clear(); /we'd like to look at the characters 
char ch; 


while (cin>s>ch){ //throw away non-digits 
if (isdigit(ch)) { 
cin.unget(); //put the digit back, 
I so that we can read the number 
return; 


} 


error("no input"); eof or bad: give up 


} 
已 经 有 了 上 面 的 “工具 函数 " skip_to_int( ) 后 , 代码 就 可 以 改写 为 : 


cout << "Please enter an integer in the range 1 to 10 (inclusive):\n"; 


intn = 0; 
while (true) { 
if (cins>n){ /we gotan integer; now check it 
if (1<=n && n<=10) break; 
cout<< Sorry " <<n 
<< "js notin the [1:10] range; please try againn"; 
} 
else { 
cout << "Sorry, that was not a number; please try againn"; 
skip_to_int(); 
} 
} 


I if we get here n is in [1:10] 
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这 段 代码 就 好 多 了 , 但 它 还 是 太 长 、 太 乱 , 很 难 在 程序 中 多 次 使 用 。 需 要 进行 大 量 的 测试 , 才能 
保证 其 正确 性 。 
我 们 到 底 需 要 什么 样 的 操作 呢 ? 一 个 看 起 来 挺 合 理 的 答案 是 :“ 我 们 需要 一 个 读 取 任意 一 个 
整数 的 郴 数 和 一 个 读 取 一 个 指定 范围 内 整数 的 函数 ， 如 下 所 示 : 
int get_int(); /read an int from cin 
int get_int(int low, int high); 1/ read an int in {low:high} from cin 
如 果 已 有 这 些 函 数 , 我 们 至 少 能 简单 而 又 正确 地 使 用 它们 。 不 难 写 出 如 下 代码 : 
int get_int0) 
{ 
intn = 0; 
while (true) { 


if (cin >> n) return n; 
cout << "Sorry, that was not a number; please try again\n'; 
skip_to_intO; 
} 
} 


get_int( ) 顽强 地 持续 读 和 人 字符 ,直至 发 现 可 以 解释 为 整数 的 数字 符号 为 止 。 如 果 想 让 get_int( ) 结 
束 , 必须 输入 一 个 整数 或 者 键入 文件 尾 符号 (文件 尾 符号 会 使 get_int( ) 抛 出 一 个 异常 ) 。 
使 用 普通 版 本 的 get_int( ) , 我 们 可 以 写 出 具有 范围 检查 功能 的 get_int( ) : 
int get_int(int low, int high) 
{ 


cout << "Please enter an integerin the range” 
<< low << "to "<< high <<" (inclusive):\n"; 


While (true) { 
intn = get_int(); 
if (low<=n && n<=high) return n; 
cout << "Sorry" 
<<n<<" isnotinthe!l” <<low <<':' << high 
<< "] range; please try again\n"; 
} 
} 
这 个 版 本 的 get_int( ) 同样 很 项 强 , 它 利用 普通 get_int( ) 不 断 读 取 整 数 , 直至 读 人 的 值 在 所 需 范围 
之 内 。 
我 们 现在 就 可 以 像 下 面 代 码 这 样 读 取 整 数 了 : 
int n = get_int(1,10); 
cout << "Nn: "<<n<<endl; 


int m = get_int(2,300); 
cout << um: "<<m<<endl; 


不 要 忘记 在 某 处 捕获 异常 ， 这样， 当 get_int( ) 确实 不 能 读 入 一 个 整数 时 (虽然 可 能 很 罕见 ) , 我 们 
就 可 以 给 出 恰当 的 错误 信息 。 
10.7.2 ”将 人 机 对 话 从 函数 中 分 离 

现在 的 get_int( ) 函数 还 是 混合 着 读 取 输 入 的 代码 和 打印 提示 信息 的 代码 。 对 于 一 个 简单 的 
程序 来 说 , 这 可 能 没有 什么 问题 。 但 在 一 个 大 型 程序 中 , 可 能 要 打印 不 同 的 提示 信息 。 例 如 , 可 
能 要 想象 下 面 这 样 调用 get_int( ) : 


int strength = get_int(1,10, "enter strength "Not in range, try again"); 
cout << "strength: " << strength << endl; 
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int altitude = get_int(0,50000, 
"please enter altitude in feet”, 
"Not in range, please try again"); 
cout << "altitude: " << aititude << "f above sea levei\n"; 


一 种 可 能 的 实现 如 下 : 
int get_int(int low, int high, const string& greeting, const string& sorry) 
{ 


cout << greeting << ": {" << low << ':' << high << "In"; 


while (true) { 
int n = get_intO); 
if (low<=n && n<=high) return n; 
cout << sorry << ™: [" << low << ': << high << "Mn'; 
} 
} 


生成 任意 提示 信息 是 很 困难 的 , 所 以 我 们 采取 了 “程式 化 "的 方式 。 这 通常 就 足够 了 , 生成 真正 任 
意 可 变 的 提示 信息 ， 比 如 支持 很 多 自然 语言 (如 阿拉 伯 语 、 孟加拉 语 、 汉语 、 丹 麦 语 、 英语 以 及 法 
语 ), 并 不 是 一 个 初学 者 之 力所能及 的 。 

注意 , 我 们 的 解决 方案 仍 是 不 完整 的 : 不 进行 范围 检查 的 get_int( ) 版 本 仍 是 个 “多 嘴 的 人 ”。 
这 里 所 体现 出 的 深层 次 的 问题 是 :“ 工 具 函 数 "会 在 程序 中 很 多 地 方 被 调用 ,因此 不 应 该 将 提示 信 
奶 “ 硬 编码 ”到 函数 中 。 更 进一步 , 库 函 数 会 在 很 多 程序 中 被 使 用 , 也 不 应 该 向 用 户 输出 任何 信 
息 一 一 毕竟 ,编写 库 的 程序 员 甚至 可 能 不 知道 使 用 库 函 数 的 程序 所 运行 的 计算 机 是 否 有 人 在 操 
作 , 因此 在 库 函 数 中 输出 信息 有 可 能 上 毫 无 意义 。 这 也 是 为 什么 error( ) 函数 并 没有 简单 地 输出 一 条 
错误 信息 (参见 5. 6. 3 节 ), 因为 一 般 来 说 , 我 们 无 法 知道 向 何 处 输出 。 


10.8 用 户 自 定义 输出 操作 符 


为 一 个 给 定 类 型 定义 输出 操作 符 << 是 一 件 很 简单 的 事情 。 要 考虑 的 主要 问题 是 不 同人 可 能 
喜欢 不 同 的 输出 形式 , 因此 很 难 达成 一 个 单一 的 格式 。 但 即便 无 法 提供 一 个 令 所 有 人 都 满意 的 单 
一 输出 格式 , 为 用 户 自 定义 类 型 定义 输出 操作 符 << 通 常 也 是 一 个 好 的 策略 。 这 样 , 我 们 至 少 可 
以 在 调试 和 早期 开发 期 间 , 很 容易 地 输出 这 个 类 型 的 对 象 。 后 期 , 我们 可 以 提供 一 个 更 为 复杂 
的 <<，, 允许 用 户 给 出 格式 信息 。 而 且 , 如 果 我 们 希望 输出 样式 与 << 提供 的 不 同 , 可 以 简单 地 绕 
过 <<，, 按照 我 们 希望 的 格式 直接 输出 用 户 自 定义 类 型 中 的 内 容 。 

下 面 是 为 9. 8 节 中 Date 类 型 定义 的 一 个 简单 的 输出 操作 符 , 它 简单 地 打印 年 、 月 、 日 , 用 去 
号 分 隔 ， 两边 加 括号 : 


ostream& operator<<(ostream& os, const Date& d) 
{ 
return 0s << '(' << d.year() 
<< << dd.month() 
<< 1 <<d.day() << ")'; 


} 
这 个 输出 操作 符 会 将 2004 年 8 月 30 日 打印 为 “(2004, 8, 30) ”的 形式 。 这 种 简单 的 成 员 列表 的 表 
示 方 式 , 对 于 成 员 数 较 少 的 类 型 来 说 很 适合 , 除非 我 们 有 更 好 的 想法 或 者 更 特殊 的 需求 。 

在 9.6 节 中 , 我 们 提 到 , 处 理 一 个 用 户 自 定义 运算 符 , 实际 是 调用 对 应 的 函数 。 下 面 就 是 一 
个 例子 , 假定 已 经 为 Date 定义 了 上 面 的 << 操作 符 , 那么 


cout << di; 


等 价 于 (其 中 dl 是 Date 类 型 的 对 象 ) : 
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operator<<(cout,d1); 


请 注意 operator << ( ) 是 如 何 接受 一 个 ostream& 作为 第 一 个 参数 ,又 将 其 作为 返回 值 返回 的 。 这 
就 是 为 什么 你 可 以 将 输出 操作 “链接 "起 来 , 因为 输出 流 按 这 种 方式 逐步 传递 下 去 了 。 例 如 ,你 可 
以 像 下 面 这 样 输出 两 个 日 期 : 


cout << d1 << d2; 


这 实际 上 是 通过 首先 解析 第 一 个 << ,然后 再 解析 第 二 个 << 来 实现 的 : 


cout << d1<< d2; //means operator<<(cout,d1} << d2; 
/ means operator<<{(operator<<(cout,d1),d2); 


也 就 是 说 , 连续 输出 两 个 对 象 dl 和 d2, dl 的 输出 流 是 cout, 而 d2 的 输出 流 是 第 一 个 输出 操作 的 
返回 结果 。 实 际 上 , 为 了 输出 dl 和 2, 上 面 代 码 中 所 示 的 三 种 写法 中 任何 一 种 都 是 可 以 的 。 当 
然 , 我 们 知道 哪 种 最 简洁 、 最 易 读 。 


10. 9 用 户 自 定义 输入 操作 符 


为 一 个 给 定 类 型 和 指定 的 输入 格式 定义 输入 操作 符 >> ,关键 在 于 错误 处 理 ,， 因 此 可 能 会 很 
束 手 。 z 

下 面 是 为 9.8 节 中 Date 类 型 定义 的 一 个 简单 的 输入 操作 符 , 它 要 求 的 输入 格式 与 上 一 节 定 义 
的 << 的 输出 格式 相同 : 


istream& operator>>(istreame& is, Date& dd) 
{ 
int y, mv d; 
char ch1, ch2, ch3, ch4; 
is >> ch1 >> y >> ch2 >> m >> ch3 >> d >> ch4; 
if (lis) return is; 
if (ch1?="( | ch21= | ch3!1="," || ch4l=)) { /oops: format error 
is,clear(ios_base: :failbit); 
return is; 


} 
dd = Date(yDate::Month(m),d); /update dd 
return is; 


} 
这 个 >> 运算 符 读 人 人 形 如 “(2004, 8, 20) ”的 申 , 并 尝试 用 这 三 个 整数 创建 一 个 Date 对 象 。 如 往常 
一 样 , 输入 比 输 出 难处 理 得 多 。 输 入 比 输 出 更 容易 出 错 , 实际 应 用 中 也 确实 如 此 。 

如 果 未 发 现 “ (整数 , 整数 , 整数 ) ”格式 的 输入 ，>> 运算 符 会 令 流 进入 一 个 非 正常 状态 (fail, eof 
或 bad), 并 且 不 会 改变 目标 Date 对 象 的 值 。 成 员 函 数 clear( ) 用 来 设置 流 的 状态 。 显 然 , ios_base :: 
failbit 将 使 流 进入 fail( ) 状态 。 在 输入 故障 的 情况 下 保持 目标 Date 对 象 不 变 是 一 个 理想 的 策略 , 这 
会 使 代码 更 干净 。 对 于 一 个 opeartor >> ( ) 来 说 , 理想 目标 是 不 读 取 或 丢弃 任何 它 未 用 到 的 字符 , 但 
这 太 困 难 了 : 因为 我 们 可 能 必须 读 人 大 量 字符 , 才能 捕获 一 个 格式 错误 。 例 如 ,考虑 输入 “(2004， 
8, 30}”, 只 有 当 读 到 最 后 的 “} ”时 , 我 们 才能 判断 遇 到 了 一 个 格式 错误 , 而 一 般 来 说 , 指望 退回 
这 么 多 字符 是 靠不住 的 。 唯 一 肯定 可 以 保证 的 是 用 unget( ) 退回 一 个 字符 。operator >> ( ) 如 果 读 
入 一 个 不 合法 的 Date, 如 “(2004 , 8, 32)”, Date 的 构造 函数 会 抛 出 一 个 异常 , 这 会 使 我 们 跳出 函 


数 operator >> ( ) 。 
10. 10 ”一 个 标准 的 输入 循环 
在 10.5 节 中 , 我 们 学 习 了 如 何 读 写 文件 。 但 是 , 随后 我 们 就 介绍 更 为 深入 的 错误 处 理 相 关 的 
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内 容 ( 参 见 10. 6 节 ), 因此 输入 循环 还 是 最 初 的 简单 地 读 取 一 个 文件 , 从头 读 到 尾 的 方式 。 这 个 
假定 是 合理 的 , 因为 我 们 通常 对 每 个 文件 进行 独立 检查 , 看 其 是 否 有 效 。 但 是 , 我 们 通常 是 边 读 
边 检 查 的 , 下面 的 代码 给 出 了 一 个 通用 的 解决 策略 , 假定 ist 是 一 个 输入 流 : 


My_type var; : 
while (ist>>var) { // read until end of file 
I maybe check that var is valid 
/do something with var 
} 
/we can rarely recover from bad; don’t try unless you really have to: 
if (ist.bad()) error("bad input stream"); 
if (ist.fail()) { 
// was it an acceptable terminator? 
} 


/ carry on: we found end of file 
也 就 是 说 , 我 们 读 入 一 组 值 , 将 它们 保存 到 变量 中 , 当 无 法 再 读 人 值 的 时 候 , 检查 流 的 状态 , 看 看 
是 什么 原因 造成 的 。 类 似 10. 6 节 , 我 们 可 以 稍稍 改进 一 下 这 段 代 码 , 令 输 入 流 在 发 生 错误 时 抛 出 
一 个 failure 异常 。 这 使 我 们 可 以 避免 不 断 检 查 故 障 。 


/I somewhere: make ist throw an exception if it goes bad: 
ist.exceptions(ist.exceptions()jios_base::badbib; 


我 们 也 可 以 指定 一 个 字符 作为 终结 符 , 例如 : 


My_type var; 

while (ist>>var) { /read until end of fije 
l maybe check that var is valid 
// do something with var 


if (ist.failO){ /use '|' as terminator and/or separator 

ist.clear(); 

char ch; 

if (1(isb>>ch && ch== 小 )) error("bad termination of input"); 
} 


lH carry on: we found end of file or a terminator 
如 果 我 们 不 想 要 一 个 特别 的 终结 符 ， 即 只 接受 文件 尾 作 为 输入 的 终结 , 可 以 简单 地 将 error( ) 调用 
之 前 的 检测 语句 去 掉 。 但 是 , 如 果 文件 包含 蔡 套 结构 (例如 , 文件 由 按 月 读数 组 成 , 每 月 的 读数 是 
由 每 天 的 读数 组 成 的 , 而 每 天 的 读数 是 由 每 小 时 的 读数 组 成 的 , 等 等 ) , 那么 使 用 终结 符 是 很 有 用 
的 , 因此 我 们 在 后 面 的 讨论 中 都 假定 使 用 终结 符 。 

不 幸 的 是 , 这 段 代码 仍然 有 些 乱 。 特 别 是 , 在 读 人 很 多 文件 的 情况 下 , 重复 检测 终结 符 是 很 
烦人 的 。 我 们 可 以 定义 一 个 函数 来 完成 这 部 分 功能 : 


// somewhere: make ist throw if it goes bad: 
ist.exceptions(ist.exceptions()lios_base: :badbit); 


void end_of_loop(istream& ist, char term, const string& message) 


{ 
if (ist.fail(0){ /use term as terminator and/or separator 
ist.clear(); 
char ch; 
if (ist>>ch && ch==term) return; /allis fine 
error(message); 
} 
} 


于 是 输入 循环 变 为 下 面 这 样 : 
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. My_type var; | 
while (ist>>var}) { // read until end of file 
// maybe check that var is valid 


/do something with var 
- 


end_of_loop(ist,'|',"bad termination of file"); // test if we can continue 


// carry on: we found end of file or a terminator 
晃 数 end_of_loop( ) 什 么 也 不 做 , 除非 流 处 于 fail( ) 状态 。 我 们 认为 , 这样 一 个 输入 循环 结构 足够 
简单 、 足 够 通用 , 适合 很 多 应 用 。 


10. 11 ” 读 取 结 构 化 的 文件 


下 面 我 们 应 用 这 个 “标准 输入 循环 ”来 解决 一 个 实际 问题 。 同 样 , 我 们 还 是 通过 这 个 例子 来 展 
示 有 广泛 应 用 范围 的 设计 和 编程 技术 。 假 定 你 要 处 理 一 个 温度 读数 文件 ,其 结构 为 : 
。 文件 包含 若干 年 份 ( 包 含 按 月 的 读数 ) z 
ea 年 份 以 “| year” 开 始 , 后 跟 一 个 整数 , 表示 年 份 值 , 例如 1900, 然后 以 “| ”结束 。 
。 年 份 包含 若干 月 份 ( 包 含 按 日 的 读数 ) 
se 月 份 以 “{ month” 开 始 , 后 跟 一 个 三 字符 月 份 名 ,如 jan, 然后 以 “} ”结束 。 
。 读数 由 一 个 时 间 和 一 个 温度 值 组 成 
s 读数 以 “(” 开 始 , 后 跟 日 期 值 , 小 时 值 和 温度 值 ， 最 后 以 “ ) "结束 。 


例如 : 


{ year 1990 } 
{year 1991 { month jun }} 
{ year 1992 { month jan (10 61.5) } {month feb (1 1 64) (22 65.2) } } 
{year 2000 , 
{ month feb (1 1 68 ) (2 3 66.66 ) ( 1 0 67.2)} 
{month dec (15 15 ~9.2 ) (15 14 ~8.8) (14 0 -2) } 
} 


这 种 格式 有 点 怪 , 通常 结构 化 文件 的 格式 都 有 些 特别 。 现 在 工业 界 的 发 展 趋势 是 , 结构 化 文件 变 
得 更 有 规律 、 更 为 层次 化 (如 HTML 和 XML 文件 )。 但 现实 情况 是 , 我们 还 是 极 少 能 控制 需要 处 
理 的 文件 的 格式 。 文 件 的 格式 就 是 这 个 样子 , 我 们 要 做 的 就 是 正确 读 取 其 内 容 。 如 果 格 式 非常 粳 
糕 或 文件 包含 太 多 错误 , 我 们 可 以 编写 一 个 格式 转换 程序 , 将 文件 转换 为 更 适合 我 们 程序 的 格 
式 。 另 一 方面 , 通常 可 以 选择 数据 的 内 存 表示 形式 来 适应 我 们 程序 的 需求 , 因此 我 们 通常 可 以 选 
择 合适 的 输出 格式 , 来 满足 特定 的 需求 和 偏好 。 

假定 已 经 给 定 了 上 述 的 温度 读数 文件 格式 , 而 我 们 只 能 接受 它 。 幸 运 的 是 , 其 中 的 年 、 
月 等 组 成 部 分 都 是 可 以 自 识别 的 (这 有 点 像 HTML 或 XML 文件 )。 另 一 方面 , 单个 读数 的 格 
式 对 合法 性 检查 没有 什么 帮助 。 例 如 , 没有 什么 信息 可 以 帮助 我 们 处 理 下 列 情 况 : 用 户 将 日 
期 值 和 小 时 值 交换 ; 用 户 使 用 摄氏 温度 , 而 程序 期 望 的 是 华氏 温度 , 或 者 相反 。 我 们 必须 应 
对 这 些 情 况 。 z 
10. 11.1 内存 表示 

我 们 应 该 如 何在 内 存 中 表示 读数 呢 ? 一 个 很 直接 的 想法 是 定义 3 个 类 : Year、Month 和 Read- 
ing, 与 输入 准确 匹配 。Year 和 Month 在 处 理 数据 过 程 中 显然 很 有 用 : 我 们 希望 比较 不 同年 份 的 温 
度 , 计算 每 月 的 平均 温度 值 ， 比 较 一 年 中 不 同月 份 的 温度 ， 比 较 不 同年 份 相同 月 份 的 温度 , 将 温 
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度 读数 与 日 照 记 录 和 湿度 读数 进行 匹配 ,等 等 。 本 质 上 说 ，Year 和 Month 与 我 们 思考 温度 和 和 无 所 
的 一 般 方式 是 吻合 的 : Month 包含 了 一 个 月 的 信息 , 而 Year 包含 了 一 年 的 信息 .但 是 Reading 怎 
么 样 呢 ? 它 实际 上 与 硬件 (如 传感器 ) 的 底层 表示 形式 吻合 。 一 个 Readins 对 银 的 数据 “( 日期, 小 
时 , 温度 )" 显 得 很 奇怪 , 而 且 只 在 Month 对 象 内 才 有 意义 。 它 还 是 非 结构 化 的 ; 读数 不 保证 按 日 
期 或 小 时 顺序 给 出 。 基 本 上 ，, 无 论 何 时 我 们 想 对 读数 进行 感 兴趣 的 操作 时 , 都 要 进行 排序 。 

对 于 温度 数据 的 内 存 表示 ，, 我 们 作 如 下 假定 : 

。 如 有 果 获 得 了 某 月 的 任何 一 个 读数 , 我 们 很 可 能 会 读 取 该 月 的 其 他 很 多 读数 。 

。 如 果 获 得 了 某 日 的 一 个 读数 , 我 们 很 可 能 会 读 取 该 日 的 很 多 读数 。 
如 果 情 况 确实 如 此 , 我 们 有 必要 将 Year 表示 为 包含 12 个 Month 的 向 量 ，Month 包含 30 个 Day 的 
向量 , 而 Day 包含 24 个 温度 值 ( 每 小 时 一 个 ) 。 对 于 很 多 应 用 来 说 , 这 种 方式 简单 、 易 于 处 理 。 因 
此 ，Day、Month 和 Year 都 是 简单 数据 结构 ,只 是 带 有 构造 函数 。 由 于 我 们 计划 在 获取 温度 读数 之 
前 就 创建 Month 和 Day, 作为 Year 的 一 部 分 , 因此 我 们 需要 一 个 “ 非 读数 ”的 概念 , 来 表示 某 个 小 
时 数据 还 未 读 人 。 

const int not a_reading = -7777;  //less than absolute zero 
类 似 地 , 我 们 引入“ 非 月 份 "的 概念 来 直接 表示 未 读 人 数据 的 月 份 , 以免 不 得 不 搜索 该 月 所 有 日 期 
来 确定 不 包含 的 数据 : 

const int not_a_month = -1; 


于 是 3 个 关键 的 类 可 以 定义 如 下 : 
struct Day { 
Vector<double> hour; 
Day0; / initialize hours to “not a reading” 
}); 


Day::Day() 
: hour(24) 
{ 
for (int i = 0; i<hour.size(); ++i) hour[i]j=not_a_reading; 
) | 
struct Month{  //a month of temperature readings 
int month; 1 [0:11] January is 0 
vector<Day> day; //[1:31] one vector of readings per day 
Month() /at most 31 days in a month (day[0] wasted) 
:month(not_a_month), day(32) {} 
}; 


struct Year { //a year of temperature readings, organized by month 


int year; I positive == A.D. 
vector<Month> month;  //[0:11] January is 0 
Year() :month(12) { } 112 months in a year 


}; 
每 个 类 本 质 上 是 一 个 简单 向 量 , 而 Month 和 Year 各 有 一 个 成 员 month 和 year， 用 来 表示 月 份 
和 年 份 。 

这 里 用 到 了 好 几 个 “ 魔 数 " (例如 24、32 和 12) 。 我 们 试图 避免 在 程序 中 使 用 这 种 文字 常量 。 
这 里 使 用 的 几 个 常量 都 是 非常 基本 的 (一 年 有 几 个 月 几乎 是 不 会 改变 的 ) , 而 且 不 会 在 程序 其 他 部 
分 使 用 。 但 是 , 我 们 保留 它们 并 不 是 因为 合理 , 而 主要 是 为 了 能 够 提醒 你 “ 魔 数 ”所 存在 的 问题 ， 
符号 常量 几乎 永远 都 是 更 好 的 选择 (参见 7.6. 1 节 )。 使 用 32 作为 一 个 月 中 的 天 数 , 肯定 要 进行 
合理 的 解释 , 此 处 , 32 显然 就 是 “有 魔力 的 ”。 
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务 二 部 分 稻 入 和 扮 出 


10. 11. 2 ” 读 取 结构 化 的 值 
类 Reading 值 用 来 读 取 输 入 ,因而 很 简单 : 


struct Reading { 

int day; 

int hour; 

double temperature; 
}; 


istream& operator>>(istream& is, Reading& 中 
j read a temperature reading from is into r 
/format:(349.7) 

j check format but don't bother with data validity 


{ 


} 


char ch1; 
i (is>>ch1 && ch1l='(){ /could it be a Reading? 
is.unget(); 


is.clear(ios_base: :failbit); 
return is; 


} 


char ch2; 

int d; 

int h; 

double t; 

is >> d >> h >> t >> ch2; . 

if (Vis | ch21=")") error("bad reading");  // messed-up reading 
rday=d; 

rhour = h; 

rtemperature = ft; 

return is; 


基本 上 , 我 们 还 是 先 检查 格式 是 否 合 法 , 如 果 不 合法 , 我 们 将 文件 状态 置 为 fail( ) 并 返回 。 这 人 允许 
我 们 尝试 通过 其 他 方式 读 取信 息 。 另 一 方面 , 如 果 在 读 取 了 一 些 数 据 后 才 发 现 格 式 错误 ,就 没有 
了 错误 恢复 的 机 会 , 我 们 只 能 通过 error( ) 退 出 。 

Month 的 实现 大 致 一 样 ， 只 有 一 点 不 同 : 必须 读 人 任意 数目 的 Reading 对 象 ， 而 不 是 像 Read- 
ing 的 >> 那样 只 需 读 取 一 组 固定 个 数 的 值 : 

istream& operator>>(istream& is, Month& m) 


j read a month from is into m 
W format: { month feb . . . } 


{ 


char ch = 0; 

if (is >> ch && ch1l='{') { 
is.unget(); 
is.clear(ios_base: :failbit); /we failed to read a Month 
return is; 


} 


string month_marker; 

string mm; 

is >> month_marker >> mm; 

if (Tis | month_marker!="month") error("bad start of month"); 
m.month = month_to_int(mm); 


Reading r; 
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int dupjicates = 0; 
int invalids = 0; 
while (is >> r) { 
if (is_valid(r)) { 
if (m.daylr.day].hour[r.hour] != not_a_reading) 
++duplicates; , 
m.daylr.day].hourir.hour] = rtemperature; 


else 
++invalids; 
} 
if (invalids) error("invalid readings in month",invalids); 
if (duplicates) error("duplicate readings in month", duplicates); 
end_of loop(is,’}',"bad end of month"); 
return is; 


} 
我 们 随后 再 来 讨论 month_to_int( ) , 它 将 月 份 的 符号 表示 (如 jun) 转 换 为 一 个 0 到 11 之 间 的 整数 
值 。 注 意 , 代码 中 使 用 了 10. 10 节 中 给 出 的 end_of_loop( ) 来 检测 终结 符 。 我 们 对 不 合法 的 和 重复 
的 Reading 进行 计数 , 这 对 有 的 人 可 能 会 有 用 。 

Month 的 >> 会 快速 检查 Reading 对 象 的 合法 性 ， 然 后 将 其 存 人 向 量 ; 


const int implausible_min = -200; 
const int implausible_max = 200; 


bool is_valid(const Reading& r) 
/a rough test 


{ 
if (r.day<1 || 31<r.day) return false; 
if (rhour<0 || 23<7.hour) return false; 
if (r.temperature<implausible_minl| implausible_max<r.temperature) 
return false; 
return true; 
} 


最 后 , 我 们 可 以 设计 Year 的 输入 函数 , 与 Month 的 类 似 : 


istream& operator>>(istream& is, Year& y) 
// read a year from is into y 

/format: { year 1972 ...} 

{ 


char ch; 

is >> ch; 

if (ch!="{") { 
is.unget(); 
is.clear(ios: :failbit); 
return is; 


} 


string year_marker; 

int yy; 

is >> year_marker >> yy; 

if (lis || year_marker1="year") error("bad start of year"); 
y.year = yy; 


while(true) { 
Monthm; /geta clean m each time around 
if(l(is >> m)) break; 
ymonth[m.month] = m; 


} 


end_of_loop(is,'}',"bad end of year"); 
return is; ， 
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我 们 当然 想 将 “烦人 的 相似 ” 变 成 就 是 “相似 ”, 这 样 就 可 以 将 这 几 段 代码 合 而 为 一 了 , 但 其 中 有 一 
个 重要 的 不 同 。 请 看 输入 循环 ,下 面 的 代码 是 你 所 期 竺 的 吗 ? 


Month m; 
while (is >> m) 
ymonthIm.month] = m; 


也 许 是 ,因为 这 就 是 目前 为 止 我 们 设计 输入 循环 的 方法 ， 但 它 是 错 的 。 问 题 在 于 operator >> 
(istream& is，Month& m) 并 不 为 m 赋予 新 值 , 而 只 是 简单 地 将 Reading 中 的 数据 填 人 m。 因 此 , 反 
复 执行 is >> m 会 不 断 将 数据 填 人 唯一 的 一 个 Month 对 象 m。 精 糕 ! 每 一 个 月 份 实际 上 都 从 同年 
之 前 月 份 继承 了 所 有 读数 , 而 没有 清空 该 月 不 包含 的 读数 。 因 此 , 每 次 执行 js >> m 时 , 我 们 需要 
一 个 绒 新 的 、 干净 的 Month 对 象 。 最 简单 的 方法 是 将 m 的 定义 移 人 循环 内 , 这 样 每 次 执行 is >>m 

前 都 会 对 其 初始 化 。 另 一 种 方式 是 令 operator > > (istream& is ，Month& m) 在 读 人 数据 之 前 将 m 置 
空 9 或 者 计 输 入 循环 完成 这 一 工作 。 

Month m; 

while (is >> m) { 

y.monthtm.month] = m; 


m= Month(); / “reinitialize” m 


} 
试 试 下 面 的 程序 : 


// open an input file: 

cout << "Please enter input file name\n"; 
string name; 

cin >> name; 

ifstream ifs(name.c_str()); 

if (1ifs) error("can't open input file",name); 


ifs.exceptions(ifs.exceptionsQlios_base::badbit); /throw for bad() 


// open an output file: 

cout << "Please enter output file name\n"; 
cin >> name; 

ofstream ofs(name.c_str()); 

if (10fs) error("can't open output file" name); 


// read an arbitrary number of years: 


vector<Year> ys; 

while(true) { 
Year y; // get a freshiy initialized Year each time around 
if (1 (ifs>>y)) break; 


ys.push_back(y); 
} 


cout << "read " << ys.size() << " years of readings\n"; 

for (int i = 0; i<ys.size(); ++i) print_ year(ofs,ys[i]); 
我 们 把 print_year( ) 的 实现 作为 练习 。 
10. 11. 3 改变 表示 方法 

为 了 使 Month 的 >> 能 正常 工作 , 我 们 需要 提供 一 个 方法 , 能 读 和 人 月份 的 符号 表示 , 并 转换 为 
0 到 11 之 间 的 整数 值 。 一 种 元 长 的 表示 方法 是 使 用 让 语句: 


if (s=="jan") 
m=1; 

else if (s=="feb") 
m=2; 
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这 种 方法 不 仅 元 长 ， 而 且 将 月 份 名 硬 编 码 到 了 程序 中 。 更 好 的 方法 是 将 月 份 名 存 人 一 个 表 中 , 使 
得 即便 我 们 不 得 不 改变 符号 表示 时 , 也 无 需 改 动 主 程序 。 我 们 决定 用 一 个 向 量 vector < string > 来 
摘 述 月 份 的 符号 表示 ,另外 设计 一 个 初始 化 函数 和 一 个 查找 函数 : 


vector<string> month_input_tbl; /month_input_tbjI0]==”janm" 


void init_input_tbl(vector<string>& tbl) 

HA initialize vector of input representations 

1 
tbl.push_back("jan"); 
tbl.push_back("feb"); 
tbl,push_back("mar"); 
tbl.push_back("apr"); 
tbl.push_back(”"may"); 
tbl.push_back("jun"); 
tbl,.push_back( jul”); 
tbl.push_back("aug"); 
tbl.push_back("sep"); 
tbl.push_back("oct"); 
tbl.push_back("nov"); 
tbl,push_back("dec"); 

} 


int month_to_int(string s) 
/issthe name of a month? !f so return its index {0:11] otherwise -1 
{《 
for (int i=0; i<12; ++i) if (month_input_tbl[i]==s) return i; 
return -1; 


} 
免得 你 疑惑 ; C++ 标准 库 提供 了 一 种 简单 的 方法 来 完成 相同 的 工作 , 参见 21. 6. 1 节 map < string. 
int > 的 相关 内 容 。 

当 需 要 进行 输出 时 , 我 们 将 面临 一 个 相反 的 问题 。 我 们 在 内 存 中 用 一 个 整数 表示 月 份 , 但 输 
出 时 希望 用 符号 表示 的 形式 。 解 决 方案 与 输入 基本 相似 , 只 是 把 string 到 int 的 映射 表 变 为 int 到 
string 的 映射 表 : 


vector<string> month_print_tbl;  / month_print_tblI[0j==?anuary" 


void init_print_tbl(vector<string>& tb}) 

Winitialize vector of output representations 

{《 
tbl.push_back("jJanuary”); 
tbl.push_back( February”); 
tbl.push_back("March"); 
tbi.push_back("April"); 
tbl.push_back("May"); 
tbl.push_back("June"); 
tbl.push_back("July"); 
tbli.push_back("August"); 
tbl.push_back("September"); 
tbl.push_back(”"October"); 
tbl,.push_back("November"); 
tbl.push_back("December"); 

} 


string int to_month(int i) 
lH months 10:11] 


if (i<0 || 12<=i) error(”bad month index"); 
return imonth_print tbli 


我 们 需要 在 某 处 调用 初始 化 函数 ,比如 在 主 函数 main( ) 的 开始 处 : 
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1 first initialize representation tables:: 

init_print_tbltmonth_print_tbl); 

init_input_tbl(month_input_tbl); 
好 了 , 你 是 否 真正 阅读 了 全 部 代码 和 注释 了 呢 ? 还 是 眼睛 一 瞬 就 跳 到 末尾 了 ? 记 住 , 学 习 编 写 高 
质量 代码 的 最 好 途径 就 是 阅读 大 量 代码 。 不 管 你 信 不 信 , 本 例 中 我 们 使 用 的 方法 很 简单 , 但 在 没 
有 帮助 的 情况 下 领悟 其 精 骨 并 不 容易 。 读 取 数 据 是 很 基本 的 , 正确 编写 输入 循环 (正确 初始 化 用 
到 的 变量 ) 是 很 基本 的 , 转换 表示 方式 也 很 基本 。 也 就 是 说 , 你 应 该 学 会 这 些 。 唯 一 的 问题 是 , 你 
是 否 能 学 会 很 好 地 使 用 这 些 技术 , 以 及 是 否 会 错过 太 多 以 至 于 不 能 学 好 这 些 基 本 技术 。 


3 简单 练习 


1. 开始 编写 一 个 程序 平面 中 的 点 , 使 用 10. 4 节 中 所 讨论 的 技术 , 首先 定义 包含 两 个 表示 坐标 的 成 员 x 和 y 
的 数据 类 型 Point。 
2. 借助 10.4 节 中 给 出 的 代码 和 讨论 的 技术 , 提示 用 户 输 入 7 个 (x, y) 值 对 。 当 用 户 输入 数据 时 , 将 其 保存 
在 一 个 名 为 original_points 的 向 量 中 。 
3. 打印 original_points 中 的 数据 , 看 看 结果 如 何 。 
4. 打开 一 个 ofstream, 将 每 个 点 输出 到 名 为 mydata. txt 的 文件 。 在 Windows 平台 上 , 我 们 建议 使 用 . txt 后 缀 ， 
这 样 使 用 传统 的 文本 编辑 器 ( 如 写字 板 ) 可 以 很 容易 地 查看 文件 中 的 数据 。 
5. 关闭 ofstream , 然后 打开 一 个 ifstream, 与 mydata. txt 关联 。 从 mydata. txt 中 读 取 数据 , 保存 在 一 个 名 为 pro- 
cessed_points 的 新 的 向 量 中 。 
6. 打印 两 个 回 量 中 的 数据 元 素 。 
7. 比较 两 个 向 量 ， 如 果 发 现 元 索 数 目 或 值 不 符 , 打印 “ Something "s wrong!”。 
人 二》 思考 题 
， 对 于 大 多 数 现代 计算 机 系统 ,处 理 输入 和 输出 时 , 要 处 理 的 设备 种 类 有 哪些 ? 
.istream 的 基本 功能 是 什么 ? 
.ostream 的 基本 功能 是 什么 ? 
.从 本 质 上 看 , 文件 是 什么 ? 
. 什么 是 文件 格式 ? 
. 给 出 4 种 需要 进行 WO 的 设备 类 型 。 
. 读 取 一 个 文件 的 4 个 步骤 是 什么 ? 
. 写 一 个 文件 的 4 个 步骤 是 什么 ? 
. 给 出 4 种 流 状态 的 名 称 和 定义 。 
， 讨论 如 何 解决 如 下 输入 问题 : 
a) 用 户 输 入 了 要 求 范围 之 外 的 值 。 
b) 未 读 到 值 (到 达 文 件 末 尾 ) 。 
c) 用 户 输入 了 错误 类 型 的 数据 。 
11. 输入 通常 在 哪些 方面 比 输出 困难 ? 
12. 输出 通常 在 哪些 方面 比 输入 困难 ? 
13. 我 们 为 什么 通常 希望 将 输入 /输出 与 计算 分 离 ? 
14. istream 的 成 员 函 数 clear( ) 最 常用 的 两 个 用 途 是 什么 ? 
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15. 对 于 一 个 用 户 自 定义 类 型 X，<< 和 >> 通 常 的 函数 声明 形式 如 何 ? 

马术 语 
bad( ) good( ) ostream buffer ifstream 输出 设备 
clear( ) 输入 设备 输出 运算 符 close( ) 输入 运算 符 。” 流 状态 


设备 驱动 程序 。 iostream 结构 化 文件 eof( ) istream 终结 符 
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fail( ) ofstream unget( ) 文件 open( ) 


习题 


l. 
过 


二 


4. 


5. 


6. 


7. 
8. 
9， 


一 个 文件 中 保存 以 空白 符 间 隔 的 整数 ， 编 写 程序 求 此 文件 中 所 有 整数 之 和 。 

编写 程序 , 创建 一 个 温度 读数 文件 , 数据 格式 为 Reading 类 型 ，Reading 的 定义 如 10.5 节 所 述 , 向 文件 中 
填 人 至 少 50 个 温度 读数 。 将 此 程序 命名 为 store_temps. cpp, 读数 文件 命名 为 raw_temps. txt。 

编写 程序 , 从 习题 2 创建 的 raw_temps. txt 中 读 取 数据 , 存 人 一 个 向 量 , 随后 计算 数据 集中 温度 的 均值 和 
中 间 值 。 将 此 程序 命名 为 temp_stats. cpp。 

修改 习题 2 中 的 程序 store_temps. cpp ， 为 每 个 读数 附加 一 个 后 级 e 或 者 后 缀 {f， 分 别 表示 摄氏 温度 和 华氏 
温度 。 然 后 修改 程序 temp_stats. cpp, 检测 每 个 温度 读数 , 在 存 人 癌 量 之 前 将 摄氏 温度 转换 为 华氏 温度 。 
编写 10. 11. 2 节 中 提 到 的 print_year( ) 函数 。 

定义 Roman_int 类 , 保存 罗马 数字 ( 以 int 类 型 保存 ), 为 其 定义 << 和 >> 运算 符 。 为 其 定义 as_int( ) 成 员 
晴 数 , 返回 int 型 值 , 使 得 对 于 Roman_int 对 和 象 , 可 以 写 出 语句 cout <<“Roman” <<r<<“equals” <<r. as_ 
int( ) << nn ;。 

修改 第 7 章 中 的 计算 器 程序 , 使 其 接受 罗马 数字 而 不 是 阿拉 伯 数 字 , 例如 XXI + CIV == CXXV。 

编写 程序 , 接受 两 个 文件 名 , 生成 一 个 新 文件 , 内 容 为 两 个 输入 文件 的 拼接 。 

两 个 文件 包含 已 排序 的 、 空白 符 间隔 的 单词 , 编写 程序 将 它们 合并 , 结果 文件 中 单词 仍 有 序 排列 。 


10. 改写 第 7 章 中 的 计算 器 程序 , 增加 “from x" 命 令 , 使 其 从 文件 x 获取 输入 。 增 加 一 个 “to y" 命 令 , 实现 输 


11. 


12. 


出 到 文件 y( 包 括 计 算 结 果 和 错误 信息 )。 设 计 一 系列 的 测试 用 例 , 设计 思路 如 7.3 节 所 述 , 用 它们 来 测 
试 改写 后 的 计算 器 程序 。 讨 论 如 何 将 这 两 个 命令 用 于 计算 器 程序 的 测试 。 

编写 程序 ,对 于 一 个 文本 文件 , 找 出 其 中 空 日 符 间 隔 开 的 所 有 整数 , 求 它们 的 和 。 例 如 ,“ bear: 17 ele- 
phants 9 end” 应 该 输出 26。 

编写 程序 , 对 于 给 定 的 一 个 文件 名 和 一 个 单词 , 输出 文件 中 包含 这 个 单词 的 所 有 行 以 及 行 号。 提示 : 
getline( ) 。 


“》 附 言 


很 多 计算 过 程 都 包含 将 大 量 数据 从 某 处 移动 到 另 一 处 的 操作 , 例如 , 将 文件 中 的 文本 复制 到 屏幕 ,或 者 


将 音乐 从 计算 机 移动 到 MP3 播放 器 。 通 常 , 在 迁移 过 程 中 还 伴随 着 数据 转换 。 如 果 数 据 可 以 看 做 值 的 序列 
( 流 ) ，iostream 库 很 适合 处 理 这 类 任务 。 在 一 般 的 编程 工作 中 , 输入 /输出 部 分 的 编码 令 人 吃惊 地 占据 了 非 
常 大 的 比例 。 这 一 方面 是 因为 我 们 (或 我 们 的 程序 ) 需 要 大 量 数据 , 男 一 方面 是 数据 进入 程序 的 入口 正 是 错 
误 多 发 地 带 。 因 此 , 我 们 必须 努力 使 VO 部 分 更 为 简单 , 并 尽量 降低 有 害 数据 “ 汶 进 "程序 的 几率 。 
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“保持 简洁 : 尺 可 能 地 简洁 ,但 不 要 过 度 简单 化 。” 
一 一 Albert 上 Einstein 


在 本 章 中 , 我 们 着 重 介绍 如 何 采 用 第 10 章 所 提出 的 通用 iostream 框架 来 解决 特定 的 输入 / 输 
出 需求 和 偏好 。 其 中 涉及 大 量 较 为 困难 的 细节 , 这 一 方面 是 由 人 类 对 输入 内 容 的 感觉 所 决定 , 另 
一 方面 则 是 由 使 用 文件 的 实际 应 用 限制 所 决定 的 。 本 章 的 最 后 一 个 例子 会 展示 一 个 输入 流 的 设 
计 , 它 允 许 指定 间隔 符 集 合 。 


11. 1 有 规律 的 和 无 规律 的 输入 和 输出 


iostream 库 , 也 就 是 ISO C++ 标准 库 的 输入 /输出 部 分 , 为 文本 (text) 的 输入 和 输出 提供 了 一 个 
统一 的 、 可 扩展 的 框架 。 这 里 的 “文本 ” 指 的 是 任何 可 以 表示 为 字符 序列 的 数据 。 这 样 ， 当 我 们 讨论 
输入 /输出 时 , 我 们 可 以 将 1234 这 样 的 整数 也 看 做 文本 , 因为 它 可 以 写成 4 个 字符 1、2、3 和 4。 

到 目前 为 止 , 我 们 对 所 有 的 输入 源 都 是 以 相同 方式 处 理 的。 但 有 时 这 是 不 够 的 , 例如 ,， 有 些 文 
件 可 能 与 其 他 输入 源 不 同 , 在 其 中 我 们 可 以 定位 单个 字 节 ( 如 通信 连接 ) 。 类 似 地 , 我 们 还 假定 输入 / 
输出 格式 完全 由 对 象 类 型 所 决定 , 这 也 不 完全 正确 , 某 些 情况 下 这 也 是 不 够 的 。 例 如 , 我 们 常常 会 
指定 浮 点 数 输出 的 数字 个 数 (精度 ) 。 本 章 会 提出 一 些 方法 , 使 我 们 可 以 按 需 求 定制 输入 /输出 。 

作为 程序 员 , 我 们 更 喜欢 有 规律 的 输入 /输出 : 一 致 地 处 理 所 有 内 存 对 象 ; 以 相同 的 方式 处 理 
所 有 输入 源 ; 以 及 强制 一 个 单一 标准 , 限定 对 象 进 入 和 离开 系统 的 表示 方式 。 这 样 , 我 们 就 容易 
写 出 干净 、 简 单 、 更 易于 维护 而 且 通 常 更 高 效 的 代码 。 但 是 ,程序 的 存在 是 为 了 服务 于 人 类 的 ， 
而 人 类 都 有 自己 强烈 的 偏好 。 因 此 , 作为 程序 员 , 我 们 必须 力争 在 程序 复杂 性 和 满足 用 户 个 人 偏 
好 间 取 得 平衡 。 


11.2 格式 化 输出 


人 们 和 常常 会 在 意 很 多 输出 中 的 微小 细节 。 例 如 , 对 一 位 物理 学 家 来 说 , 1.25( 舍 人 到 小 数 点 
后 两 位 数字 ) 与 1.24670477 可 能 是 有 很 大 不 同 的 。 而 对 于 一 位 会 计 ,“(1.25)” 从 法 律 角度 看 与 
“(1. 2467 ) ”是 不 一 样 的 , 而 与 “1.25” 则 是 根本 不 同 的 (在 金融 文件 中 , 括号 有 时 表示 亏损 , 也 就 
是 负 值 ) 。 作 为 程序 员 , 我 们 的 目标 是 使 我 们 的 输出 尽 可 能 地 清晰 、 尽 可 能 地 接近 “客户 ”的 期 望 。 
输出 流 (ostream) 提供 了 很 多 方法 格式 化 内 置 类 型 的 输出 。 对 于 用 户 自 定义 类 型 ， 则 需要 由 程序 员 
定义 适合 的 << 操作 符 。 

对 于 输出 , 似乎 有 数 不 清 的 细节 、 优 化 的 余地 和 不 同 的 选择 需要 考虑 ; 对 于 输入 , 要 考虑 的 
类 似 问题 也 不 少 。 典 型 的 例子 有 : 用 来 表示 小 数 点 的 字符 (通常 是 点 或 逗号 ) ; 输出 金额 的 方式 ; 
输出 单词 tue( 或 vrai 或 sandt) 而 不 是 数值 1 来 表示 真 ; 处 理 非 ASCI 字符 集 ( 如 Unicode ) 的 方式 ; 
以 及 限制 读 人 字符 串 的 字符 数目 等 。 除 非 你 需要 使 用 这 些 功 能 ， 否则 它们 看 起 来 很 无 趣 。 因 此 ， 
我 们 将 这 些 内 容 放 在 手册 和 专门 的 书籍 中 (如 Langer 的 《Standard C++ IOStreams and Locales》、 
Stroustrup 的 《The C++ Programming Language》 的 第 21 章 以 及 《ISO C++ 标准》 的 第 22 和 27 章 )。 
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本 书 只 介绍 一 些 最 常用 的 功能 和 一 些 一 般 性 概念 。 
11. 2.1 输出 整数 

整数 值 可 以 输出 为 八进制 (octal, 基底 为 8 的 数 制 系统 )、 十 进 制 ( decimal ， 人 类 常用 的 数 制 系 
统 ,基底 为 10) 和 十 六 进 制 (hexadecimal ,基底 为 16 的 数 制 系统 ) 。 如 果 你 不 了 解 这 些 数 制 ,请 参 
考 附录 A. 2. 1. 1, 然后 再 继续 学 习 本 章 。 大 多 数 输出 部 使 用 十 进 制 。 十 六 进 制 多 用 于 输出 硬件 相 
关 的 信息 , 原因 在 于 一 个 十 六 进 制 数字 精确 地 表示 了 4 位 二 进 制 值 。 因 此 , 两 个 十 六 进 制 数字 可 
以 用 来 表示 一 个 8 位 字 节 , 4 个 十 六 进 制 数字 表示 2 字 节 的 值 (通常 称 为 半 字 ), 8 个 十 六 进 制 数 
则 表示 4 字 市 的 值 (通常 是 一 个 字 或 一 个 寄存 右 的 大 小 )。 当 20 世纪 70 年 代 C 语言 (C++ 的 祖 
先 ) 最初 发 明之 时 , 表示 二 进 制 位 更 多 采用 八进制 , 现在 则 很 少 使 用 了 。 

我 们 可 以 指定 (十 进 制 ) 数 1234 以 十 进 制 、 十 六 进 制 (通常 简称 为 “hex”) 或 八进制 输出 : 


cout << 1234 << '\t(decimal)\n’ 
<< hex << 1234 << Nt(hexadecimalynar 
<< oct << 1234 << \t(octal))\n"; 
字符 \t 是 “ 制 表 符 ”(tabulation character, 简称 “tab”) , 这 段 代码 会 输出 如 下 内 容 : 
1234 (decimal) 
4d2 (hexadecimal) 
2322 (octal) 


符号 << hex 和 << oct 并 不 输出 任何 内 容 。 前 者 通知 流 任何 后 来 的 整数 值 应 应 该 以 十 六 进 制 输出 ， 而 
后 者 通知 流 以 八进制 输出 后 来 的 整数 。 例 如 : 


cout << 1234 << At << hex << 1234 << At << oct << 1234 << \n'; 


cout << 1234 << \n'; Athe octal base is stil] in effect 
这 段 代 码 会 输出 : 
1234 4d2 2322 
2322 // integers will continue to show as octal until changed 


注意 ,最 后 一 行 的 输出 是 一 个 八进制 数 。 也 就 是 说 ,oct、hex 和 dec( 十 进 制 输出 ) 是 持久 的 (不 变 
的 直 按 照 这 种 数 制 输出 ， 直 至 我 们 指定 新 的 数 制 。hex 和 oct 这 种 用 来 改变 流 
的 行为 的 关键 字 称 为 操纵 符 (manipulator ) 。 
试 一 试 ”以 十 进 制 、 十 六 \ 进 制 和 八进制 输出 你 的 出 生年 份 。 为 每 个 值 加 上 标识 ， 将 
所 有 值 显示 在 一 行 上 , 利用 制 表 符 调整 值 的 列 位 置 。 然 后 再 输出 你 的 年 龄 。 

一 个 数值 以 非 十 进 制 显示 , 总 是 让 人 看 着 有 些 迷 惑 。 例 如 ,除非 我 们 告诉 你 ,和 否则 你 一 定 会 
假定 11 表示 (十 进 制 ) 数 值 11, 而 不 是 9( 八 进 制 数 11 所 表示 的 十 进 制 数值 ) ， 或 者 17( 十 六 进 制 
数 11 所 表示 的 十 进 制 数值 ) 。 为 了 缓解 这 个 问题 , 我 们 可 以 要 求 ostream 显示 每 个 整数 的 基底 。 
例如 : 


cout << 1234 << \t' << hex << 1234 << Nt << oct << 1234 << \n'; 
cout<<showbase << dec; //show bases 
cout << 1234 << \t << hex << 1234 << \t << oct << 1234 << \n'; 


会 输出 : 


1234 4d2 2322 
1234 0x4d2 02322 > 


于 是 , 十 进 制 数 将 没有 前 级 ， 八进制 数 将 带 前 级 0， 而 十 六 进 制 数 将 带 前 级 0x( 或 0X) 。 这 与 C++ 
源 程序 中 的 整数 文字 常量 的 表示 方式 是 完全 一 致 的 。 例 如 : 


cout << 1234 << \t << 0x4d2 << \t << 02322 << \n'; 


如 果 是 十 进 制 输出 格式 ， 这 段 代码 会 输出 : 
1234 1234 1234 





232 ”和 锡 二 部 分 输入 和 输出 


你 可 能 已 经 注意 到 , 与 oct 和 hex 一 样 ，showbase 也 是 持久 的 。 想 去 掉 其 效果 的 话 , 可 使 用 操纵 符 
noshowbase , 它 会 恢复 默认 效果 一 一 输出 整数 时 不 显示 基底 。 
下 表 对 整数 输出 操纵 符 作 一 个 小 结 : 


整数 输出 操纵 符 
oct 使 用 8 为 基底 (八进制 ) 表 示 
dec 使 用 10 为 基底 ( 十进制 ) 表 示 
hex / 使 用 16 为 基底 (十 六 进 制 ) 表示 
showbase 为 八进制 加 前 缀 0, 为 十 六 进 制 加 前 级 0x 
noshowbase 取消 前 组 
11.2.2 输入 整数 
默认 情况 下 ，>> 假定 数值 使 用 十 进 制 表示 , 但 你 可 以 指定 读 人 十 六 进 制 或 八进制 数 : 
int a; 
int b; 
int c， 
int d; 


cin >> a >> hex >> b >> oct >> c >> d; 
cout<<a<< "<<b < Mt < < <<d << An'; 


如 果 你 键入 : 
1234 4d2 2322 2322 
圭 面 程序 会 输出 : 


1234 1234 1234 1234 
注意 , 这 意味 着 oct、dec 和 hex 对 输入 也 是 持久 的 , 如 同 在 输出 操作 中 一 样 。 
试 一 试 ”完成 上 面 代码 ,形成 一 个 程序 。 先 尝试 前 面 给 出 的 输入 内 容 ， 然后 再 尝试 
下 面 的 输入 内 容 : 
1234 1234 1234 1234 
解释 程序 输出 的 结果 。 再 尝试 其 他 输入 ， 观 察 输出 结果 。 
你 可 以 让 >> 接受 并 正确 解释 前 缀 0 和 0x。 为 了 实现 这 一 效果 , 你 需要 “复位 "所 有 软 认 设置 ， 
例如 : 


cin.unsetf(ios: :dec); // don't assume decimal (so that Ox can mean hex) 
cin.unseti(ios: :oct); // don't assume octal (so that 12 can mean twelve) 
cin.unsetf(ios: :hex); // don't assume hexadecimal (so that 12 can mean twelve) 


流 的 成 员 函 数 unsetf( ) 将 参数 中 给 出 的 一 个 或 多 个 标志 位 复位 。 现 在 , 对 于 下 面 代码 

Cin >>a >> b >> ¢ >> d; 
如 果 你 键入 : 

1234 0x4d2 02322 02322 
会 输出 : 

1234 1234 1234 1234 
11.2.3 输出 浮 点 数 

如 果 你 直接 面 对 硬 件 的 话 ， 需 要 十 六 进 制 (或 者 八进制 ) 表示 方式 。 类 似 地 ， 如 果 你 进行 科学 
计算 , 就 必须 处 理 浮 点 数 的 格式 。 这 与 处 理 整数 值 的 方法 类 似 , 都 是 借助 于 iostream 的 操纵 符 。 
例如 : 

cout << 1234.56789 << "\A\t(genera)\n" l/ \t\t to line up columns 


<< fixed << 1234.56789 << "\t(fixed)\n" 
<< Scientific << 1234.56789 << "\t(scientific\n’; 
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会 输出 : 
1234.57 (general) 
1234.567890 (fixed) 
1.234568e+003 (scientific) 


操纵 符 fixed 和 scientific 用 来 选择 浮 点 数 格 式 。 奇 怪 的 是 , 标准 库 没 有 提供 general 操纵 符 来 设置 
默认 格式 。 不 过 , 我 们 可 以 自己 定义 一 个 ,就 像 std_lib_facilities. h 中 所 做 的 一 样 。 当 然 , 这 需要 
对 iostream 库 的 内 部 工作 机 制 有 所 了 解 : 


inline ios_base& general(ios_base& b) /to complement fixed and scientific 
// clear all floating-point format flags 

{ 
b.setf(ios_base::fmtflags(0), ios_base: :floatfield); 
return b; 


} 


现在 , 我 们 可 以 写 如 下 代码 : 

cout << 1234.56789 << 人 
<< fixed << 1234.56789 << At 
<< scientific << 1234.56789 << \n'; 

cout << 1234.56789 << \n'; // floating format “sticks” 

cout << general << 1234.56789 << \t" // warning: general isn't standard 
<< fixed << 1234.56789 << "\t' 
<< scientific << 1234.56789 << \n'; 


会 得 到 如 下 输出 : 
1234.57 1234.567890 1.234568e+003 


1.234568e+003 // scientific manipulator “sticks” 
1234.57 1234.567890 1.234568e+003 


总 之 ,基本 的 浮 点 数 输出 格式 操纵 符 小 结 如 下 : 


浮 点 数 输 出 操纵 符 
fixed 使 用 定点 表示 
ee 使 用 尾数 和 指数 表示 方式 。 尾 数 总 在 [1; 10) 之 间 , 也 就 是 说 , 在 小 数 点 之 前 有 单 
个 非 0 数字 
Een 在 general 格式 的 精度 下 ， 自动 选 择 fixed 和 scientific 两 者 中 更 为 精确 的 一 种 表示 形 
© 式 。general 是 默认 格式 , 但 如 果 想 显 式 设 定 , 你 需要 自己 定义 一 个 general( ) 
11. 2.4 精度 


默认 设置 下 ，general 格式 用 总 共 6 位 数字 来 输出 一 个 浮 点 值 。 流 会 选择 最 适合 的 格式 , 浮 点 
值 按 6 位 数字 ( general 格式 的 默认 精度 ) 所 能 表示 的 最 佳 近似 方式 进行 舍 入 。 例 如 : 

1234. 567 会 输出 1234. 57 

1. 2345678 会 输出 1. 23457 
舍 人 规则 采用 常用 的 4/5 规则 : 0 到 4 舍 , 5 到 9 入。 注意, 浮 点 格式 只 对 浮 点 数 起 作用 ,于 是 

1234567 输出 1234567( 因为 这 是 一 个 整数 ) 

1234567. 0 输出 1. 23457e +006 
在 第 二 个 例子 中 ，ostream 判断 出 1234567. 0 在 fixed 格式 下 不 能 只 用 6 位 数字 输出 , 因此 选择 sci- 
entific 格式 ,保持 最 为 精确 的 表示 形式 。 基 本 上 ，general 格式 在 scientific 和 fixed 两 种 格式 间 进 行 
选择 , 期 望 将 浮 点 数 最 精确 的 表示 形式 呈现 给 用 户 ， 所 采用 的 精度 限定 为 general 格式 的 精度 一 一 
默认 为 6 位 数字 长 度 。 

试 一 试 ”编写 代码 输出 浮 点 数 1234567. 89 三 次 ， 分 别 采 用 general 、fixed 和 scientific 
格式 。 哪 种 格式 呈现 给 用 户 最 精确 的 表示 形式 ? 说 明 原 因 。 


234 ” 免 二 部分 葵 入 和 输出 


程序 员 可 以 使 用 操纵 符 setprecision( ) 来 设置 精度 , 例如 : 
cout << 1234.56789 << \ 

<< fixed << 1234.56789 << Nt 

<< scientific << 1234.56789 << \n'; 
cout << general << setprecision(5) 
<<1234.56789 << At 

<< fixed << 1234.56789 << \t' 

<< scientific << 1234.56789 << \n'; 
cout << general << setprecision(8) 

<< 1234.56789 << \t' 

<<fixed << 1234.56789 << At 

<< scientific << 1234.56789 << \n'; 


会 输出 (注意 伟人 ) 如 下 结 末 : 


1234.57 1234.567890 1.234568e+003 
1234.6 1234.56789 1.23457e+003 


1234.5679 1234.56789000 1.23456789e+003 
几 种 格式 的 精度 分 别 定义 为 : 
浮 点 数 精度 
general 精度 就 是 数字 的 个 数 
scientific 精度 为 小 数 点 之 后 数字 的 个 数 
fixed 精度 为 小 数 点 之 后 数字 的 个 数 


一 般 使 用 默认 的 精度 为 6 的 general 格式 即 可 , 除非 有 特殊 原因 一 一 一 个 常见 的 原因 是 “我 们 需要 
更 为 精确 的 输出 ”。 
11.2.5 域 

使 用 科学 记 数 法 (scientific) 和 定点 (fixed) 格 式 , 程序 员 可 以 精确 控制 一 个 值 输出 所 占用 的 宽度 。 
显然 , 这 对 于 打印 表格 这 类 应 用 来 说 很 有 用 。 整 数 输出 也 有 类 似 的 机 制 , 称 为 域 (fiel4)。 你 可 以 使 
用 “设置 域 宽度 ”操纵 符 setw( ) 精确 指定 一 个 整数 或 一 个 字符 串 输 出 占用 多 少 个 位 置 。 例 如 : 


cout << 123456 AH no field used 
<<'|<< setw(4) << 123456 << 中/ 123456 doesn't fitiin a 4- eh field 
<< setw(8) << 123456 << 中 // set field width to 8 
<< 123456 << "MN\n"; // field sizes don't stick 
会 输出 如 下 结果 : 


123456|123456| 123456|123456| 


首先 注意 第 三 个 123456 之 前 的 两 个 空格 ， 这 就 是 我 们 所 期 望 的 效果 一 一 个 6 位 数字 的 数 占 用 
一 个 8 个 字符 的 域 。 但 是 ， 当 你 指定 一 个 4 个 字符 的 域 时 ,123456 不 会 被 截取 来 适应 域 帘 。 为 什 
么 不 进行 截取 呢 ?11234 | 或 134561 对 于 宽度 为 4 的 域 来 说 都 是 适合 的 , 但 它们 完全 改变 了 要 打印 
的 值 , 而且 没有 给 用 户 任何 警告 信息 。ostream 是 不 会 这 样 做 的 , 相反 , 它 会 打破 输出 格式 。 坏 的 
格式 几乎 永远 比 “ 坏 的 输出 数据 "要 更 好 些 。 而 且 在 使 用 域 最 多 的 应 用 中 (例如 打印 表格 )， 
出 ”问题 是 很 容易 注意 到 的 , 因此 能 得 到 修正 。. 
域 也 可 用 于 浮 点 数 和 字符 串 , 例如; 


cout << 12345 << 小 << setw(4) << 12345 << | 

<< setw(8) << 12345 << 中 << 12345 << "Nm"; 
cout << 1234.5 <<'|'<< setw(4) << 1234.5 << 小 

<< setw(8) << 1234.5 << 中 << 1234.5 << "Mn"; 
cout << "asdfg" << 中 << setw(4) << "asdfg" << 站 

<< setw(8) << "asdfg" << 中 << "asdfg" << "小 n?; 
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会 输出 如 下 结果 ， 


12345|12345| 12345|12345| 
1234.5|1234.5| 1234.5|1234.5| 
asdfglasdfg| asdfglasdfg| 


注意 , 域 宽度 不 是 持久 的 。 在 三 个 例子 中 , 第 一 个 和 最 后 一 个 值 的 输出 方式 是 “ 它 需 要 多 少 位 置 
就 占用 多 少 位置 "。 换 句 话 说 , 除非 你 在 语句 中 输出 操作 之 前 即时 设置 域 宽 , 否则 不 会 有 域 的 
限制 。 
试 一 试 编写 程序 , 创建 一 个 简单 的 表格 ,包括 你 自己 和 至 少 五 位 朋友 的 姓 、 名 、 
电话 号 码 、email 地 址 等 信息 。 试 验 不 同 的 域 宽 ,直至 表格 输出 形式 达到 你 满意 的 程度 
为 止 。 


11.3 文件 打开 和 定位 


从 C++ 程序 的 角度 看 ,文件 是 操作 系统 提供 的 一 个 抽象 。 如 10. 3 节 所 述 ,一 个 文件 就 是 一 
个 从 0 开始 编号 的 简单 的 字 节 序列 如 下 图 所 示 。 
问题 是 我 们 如 何 访问 这 些 字 节 。 如 果 使 用 iostream ， 2 rn Rs 
访问 方式 很 大 程度 上 在 我 们 打开 文件 , 将 其 与 一 个 流 相 Es 
关联 时 就 确定 了 。 流 的 属性 决定 了 文件 打开 后 我 们 可 以 对 它 执行 哪些 操作 ,以 及 这 些 操作 的 意 
义 。 最 简单 的 一 个 例子 是 , 如 果 我 们 打开 文件 关联 至 一 个 istream, 我 们 可 以 从 文件 读 取 数据 , 而 
使 用 ostream 打开 文件 的 话 , 我 们 可 以 向 文件 写 人 数据 。 
11. 3. 1 文件 打开 模式 
C++ 提供 了 多 种 文件 打开 模式 。 默 认 情 况 下 , 用 jftream 打开 的 文件 用 于 读 , 用 ofstream 打开 
的 文件 用 于 写 , 这 满足 了 大 多 数 一 般 需求 。 但 是 , 你 还 可 以 选择 其 他 方式 : 





文件 流 打开 模式 

ios_base :: app 追加 模式 ( 即 添加 在 文件 末尾 ) 

ios_base :yate “末端 " 模式 (打开 文件 并 定位 到 文件 尾 ) 
ios_base :: binary 二 进 制 模式 一 一 注意 系统 特有 的 行为 
ios_base:: in 、 用 于 读 模 式 

ios_base :: out 用 于 写 模 式 

ios_base， trunk | 将 文件 长 度 截 为 0 


在 创建 流 对 象 时 , 可 在 文件 名 之 后 指定 文件 模式 , 例如 : 


ofstream ofi(namel1);  // defaults to ios_base::out 
ifstream ifi(name2); I/ defaults to ios_base::in 


ofstream ofs(name, ios_base::app); // ofstreams are by default out 

fstream fs("myfile", ios_base::in|ios_base::out); both in and out 
在 后 一 个 例子 中 的 “1 "是 “位 或 "运算 符 (参见 附录 A. 5. 5)， 可 用 于 组 合 多 个 模式 。 app 模式 常用 
于 写 日 志文 件 , 因为 你 总 是 将 新 的 日 志 追 加 到 文件 末尾 。 

在 每 个 例子 中 , 打开 文件 的 确切 效果 依赖 于 操作 系统 , 而 且 如 果 操 作 系统 不 能 使 用 某 种 特定 
的 模式 打开 文件 的 话 , 流 可 能 会 进入 非 good( ) 状态 : 

if (1fs) // oops: we couldn't open that file that way 


以 读 模式 打开 一 个 文件 , 最 常见 的 失败 原因 是 文件 不 存在 ( 至少 文 件 名 不 是 我 们 所 指定 的 那样 ) : 
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ifstream ifs("redungs"); 
if (lifs) Werror can't open “readings” for reading 


在 本 例 中 , 我 们 猜测 是 拼写 错误 导致 了 文件 打开 失败 。 
注意 , 如 果 以 写 模式 打开 一 个 文件 , 而 文件 不 存在 的 话 , 通常 操作 系统 会 创建 一 个 新 文件 ， 
但 如 果 以 读 模式 打开 一 个 不 存在 的 文件 , 就 不 会 创建 新 文件 (这 实际 上 是 很 幸运 的 ) 。 


ofstream ofs("no-such-file"); ~// create new file called no-such-file 
ifstream ifs("no-file-of-this-name'"); // error: ifs will be not be good() 


11. 3.2 二 进 制 文件 
在 内 存 中 , 我 们 可 以 将 整数 123 表示 为 一 个 整 型 值 或 者 一 个 字符 串 值 , 如 下 所 示 : 


int n = 123; 
string s = "123"; 


在 第 一 条 语句 中 , 123 保存 为 一 个 (二 进 制 ) 数 , 与 所 有 其 他 整 型 值 占用 相同 大 小 的 内 存 空间 (在 
PC 机 上 是 4 字 节 , 32 位 ) 。 即 便 我 们 处 理 数值 12345 ， 仍然 Be EO i 123 
保存 为 一 个 三 个 字符 的 字符 串 。 如 果 我 们 处 理 123 存 为 字符 ， 长 在 酝 本寺 枉 主因 二 二 

的 是 12345, 则 保存 为 字符 串 “12345” 需 占用 5 
个 字符 (还 需要 加 上 管理 字符 串 所 需 的 固定 开 
销 ) 。 这 种 差异 如 下 图 所 示 ( 可 以 看 到 , 使 用 普 。 2 一 进 制 ， 
通 的 十 进 制 和 字符 表示 方式 , 不 如 使 用 在 计算 ”12345 存 为 二 进 制 : 
机 内 部 采用 的 二 进 制 表 示 方 式 ) ， 如 右 图 所 示 。 

当 我 们 使 用 字符 表示 方式 时 ,必须 使 用 特定 字符 表示 数值 的 结束 ,就 像 我 们 在 纸 上 书 写 数值 
一 样 : 123456 是 一 个 数 , 而 123 456 是 两 个 数 。 在 纸 上 书 写 , 我 们 使 用 空格 来 表示 数值 的 结束 。 
在 计算 机 内 存 中 , 我 们 也 可 以 这 么 做 ,如 下 图 所 示 。 

固定 长 度 的 二 进 制 表示 方式 (比如 int 型 值 ) 
和 变 长 的 字符 串 表示 方式 (比如 string 类 型 ) 之 
间 的 差别 在 文件 中 也 有 体现 。 默 认 和 情况 下 
iostream 使 用 字符 表示 方式 。 也 就 是 说 ，istream 从 文件 读 取 字符 序 享 列 ， 并 将 其 转换 为 所 需 类 型 的 
对 象 。 而 ostream 将 指定 类 型 的 对 象 转 换 为 字符 序列 ， 然 后 写 人 文件 。 但 是 ,我 们 可 以 令 istream 
和 ostream 将 对 象 在 内 存 中 对 应 的 字 节 序列 简单 地 复制 到 文件 。 这 称 为 二 进 制 (binary ) IO, 通过 
在 打开 文件 时 指定 ios_base :: binary 模式 来 实现 。 下 面 的 例子 展示 了 如 何 读 写 二 进 制 整数 文件 , 涉 
及 "二进制 "处 理 的 代码 将 在 后 面 给 出 详细 解释 : 


int main() 


{ 


mp. 站 习 
必 和 | by r 
12345 和 存 为 字 付 ; |B 









123 456 存 为 字符 : 


// open an istream for binary input from a file: 

cout << "Please enter input file name\n"; 

string name; 

cin >> name; - 

ifstream ifs(name.c_str(),ios_base::binary);  //note: stream mode 
// “binary” tells the stream not to try anything clever with the bytes 

if (Yifs) error("can't open input file ", name); 


// open an ostream for binary output to a file: 

cout << "Please enter output file name\n"; 

cin >> name; 

ofstream ofs(name.c._str(),ios_base::binary);  //note: stream mode 
/binary” tells the stream not to try anything clever with the bytes 

if (lofs) error("can't open output file ",name); 
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vector<int> v; 


// read from binary file: 

int i; 

while (ifs.read (as | bytes(i),sizeof(int))) // note: reading bytes 
v.push_back(i); | 


//...do something with v . . . 


// write to binary file: 
for(int i=0; ij<v.size(); ++j) 

. Ofs.write(as_bytes(v[i]),sizeof(int)); // note: writing bytes 
return 0; 


} 
打开 二 进 制 文件 是 通过 指定 ios_base :: binary 模式 实现 的 : 


ifstream ifs(name.c_str(), ios_base: :binary); 


ofstream ofs(name,c_str0, ios_base: :binary); 


在 本 例 中 , 我 们 使 用 相对 来 讲 较为 复杂 , 但 也 更 为 紧凑 的 二 进 制 表示 方式 。 当 我 们 从 面向 字符 的 
VO 转向 二 进 制 VO 时 , 要 放弃 常用 的 >> 和 << 操作 符 。 这 两 个 操作 符 按 默认 约定 将 值 转换 为 字 
符 序列 (例如 ,字符 串 “asdf” 转 换 为 字符 .a、s、d、f, 整数 123 转换 为 字符 1、2、3) 。 如 果 我 们 需要 
的 就 是 这 些 , 那么 也 就 不 必 使 用 二 进 制 了 , 因为 默认 模式 已 经 够 用 了 。 只 有 在 默认 模式 不 能 满足 
需求 时 , 我 们 才 需 要 使 用 二 进 制 文件 。 我 们 使 用 二 进 制 模式 ,就 是 告知 流 , 不 要 试图 对 字 节 序列 
做 任何 “聪明 ”的 处 理 。 

我 如 何 处 理 int 型 值 才 是 “聪明 的 ”? 答案 是 显然 的 一 用 4 个 字 节 存储 4 字 节 宽 的 int 型 值 ， 
也 就 是 说 , 我 们 可 以 查看 int 型 值 在 内 存 中 的 表示 方式 (4 个 字 节 的 序列 ) 并 直接 将 这 些 字 节 传输 
到 文件 。 随 后 , 我 们 就 可 以 用 同样 的 方式 读 回 这 些 字 节 重组 出 int 值 : 


ifs.read(as_bytes(i),sizeof(int)) / note: reading bytes 
ofs.write(as_bytes(v[il]),sizeof(int))  // note: writing bytes 


ostream 的 write( ) 函数 和 istream 的 read( ) 函数 都 接收 两 个 参数 : 地 址 (这 里 用 水 数 as_bytes( ) 获 
取 ) 和 字 节 (字符 ) 数 量 (这 里 我 们 用 运算 符 sizeof 获得 ) 。 对 于 我 们 要 读 / 写 的 值 , 地 址 参数 指向 保 
存 它 的 内 存 区 域 的 第 一 个 字 节 。 例如, 如果 我 们 处 理 一 个 int 型 值 1234, 其 内 存 区 域 中 保存 这 么 4 
个 字 节 的 值 : 00、00、04、d2( 十 六 进 制 表示 ) ,如 下 图 所 示 : 





函数 as_byte( ) 可 以 用 来 获取 对 象 存储 区 域 的 第 一 个 字 节 。 它 可 以 定义 如 下 (其 中 用 到 了 我 们 还 未 
介绍 的 语言 特性 , 参见 17. 8 节 和 19.3 节 ) : 


template<class T> 
char* as_bytes(T& i) /treat aT as a sequence of bytes 
{ 
void* addr = &i; // get the address of the first byte 


/ of memory used to store the object 
return static_cast<char*>(addr);  //treat that memory as bytes 
} 


使 用 static_cast 的 (不 安全 ) 类 型 转换 是 必需 的 , 我 们 需要 用 它 来 获得 一 个 变量 的 “原始 字 节 表 
示 ”。 地 址 的 概念 我 们 会 在 第 17 章 和 第 18 章 进行 详细 介绍 。 在 这 里 ,我 们 只 展示 如 何 将 内 存 中 
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的 对 象 按 字 节 序列 的 方式 处 理 , 供 read( ) 和 write( ) 使 用 。 

这 种 二 进 制 YO 方式 有 些 困 难 、 有 些 复杂 ,而且 容 易 出 错 。 但 是 作为 程序 员 , 我 们 不 是 总 有 选 
择 文件 格式 的 自由 。 因 此 , 偶尔 我 们 必须 使 用 二 进 制 文件 ,只 是 因为 我 们 要 读 写 的 文件 的 制作 者 选 
择 了 二 进 制 格式 。 另 外 , 也 有 可 能 使 用 非 字符 表示 方式 是 一 种 更 好 的 选择 。 典 型 的 例子 是 图 像 和 声 
音 文 件 , 它们 都 没有 适合 的 字符 表示 方式 : 一 幅 照 片 或 者 一 段 音乐 本 质 上 就 是 一 个 比特 包 。 

iostream 库 默认 的 字符 IO 是 可 移植 的 、 人 类 可 读 的 , 而 且 很 好 地 被 类 型 系统 所 支持 。 如 果 条 
件 允 许 , 请 尽量 使 用 字符 WO, 除非 不 得 已 , 否则 不 要 使 用 二 进 制 VO。 
11. 3.3 在 文件 中 定位 

只 要 有 可 能 ,请 尽量 使 用 从 头 至 尾 的 文件 读 写 方式 。 这 是 最 简单 也 最 不 容易 出 错 的 方式 。 很 
多 时 候 ， 当 你 觉得 必须 对 文件 进行 修改 时 , 最 好 的 方法 是 创建 一 个 新 的 文件 。 

但 是 ,如 果 你 必须 使 用 文件 定位 功能 的 话 ，C ++ 
也 支持 在 文件 中 定位 到 指定 位 置 以 进行 读 写 。 基 本 
上 , 每 个 以 读 方式 打开 的 文件 , 都 有 一 个 “ 读 / 获 取 位 
置 ”， 而 每 个 以 写 方式 打开 的 文件 , 都 有 一 个 “ 写 / 放 置 
位 置 ”， 如 右 图 所 示 。 

使 用 方法 如 下 : 


fstream fs(name.c_str());  // open for input and output 
if (1fs) error("can't open ",name); 





fs.seekg(5); // move reading position ("g’"for "get") to 5 (the 6th character) 
char ch; 
fs>>ch; // read and increment reading position 

cout << "character[l5] js ® << ch << '(' << int(ch) << ")n"; 


fs.seekp(1) //move writing position ("p" for "put’) to 1 

fs<<'y'; // write and increment writing position 
请 小 心 : 这 有 段 代码 中 在 文件 定位 之 前 进行 了 运行 时 错误 检测 , 这 是 必要 的 。 男 外 要 特别 注意 的 
是 , 如 果 你 试图 用 seekg( ) 或 seekp( ) 定 位 到 文件 尾 之 后 , 结果 如 何 是 未 定义 的 , 不 同 操 作 系 统 会 
表现 出 不 同 的 行为 。 


11.4 ”字符 串 流 


你 可 以 将 一 个 string 对 象 作为 istream 的 源 或 ostream 的 目标 。 从 一 个 字符 串 读 取 内 容 的 is- 
tream 对 象 称 为 istringstream， 保 存 字 符 并 将 其 写 人 字符 串 的 ostream 对 象 称 为 ostringstream。 例 如 ， 
从 字符 串 提取 数值 时 istringstream 就 很 有 用 : 


double str_ to_double(string s) 
.Vi possible, convert characters in s to floating-point value 


{ 
E istringstream is(s);  // make a stream so that we can read from s 
double d; 
is >> d; 
if (1is) error("double format error: ",s); 
return d; 
} 
double d1 = str to_double("12.4"); /testing 


double d2 = str_to_double("1.34e~3"); 
double d3 = str_to_double("twelve point three™); /will call error() 
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如 果 你 试图 从 一 个 stringstream 流 的 字符 串 尾 之 后 读 取 字 符 , 流 会 进入 eof( ) 状态 。 这 意味 着 你 可 
以 将 “标准 输入 循环 "应 用 于 stringstream 流 , 实际 上 一 个 字符 串 流 就 是 一 个 真正 的 istream。 

相反 ,对 于 要 求 一 个 简单 字符 串 参 数 的 系统 , 如 GUI 系统 (参见 16.5 节 ) ，ostringstream 可 用 
于 格式 化 输出 来 生成 单一 字符 串 。 例 如 


void my_code(string label, Temperature temp) 
{ 
人 
Ostringstream 0s; /stream for composing a message 
Os << Setw(8) << label << ":" 
<< fixed << setprecision(5) << temp.temp << temp.unit; 
someobject.display(Point(100,100), os.str().c_str()); 
Mis 
} 


ostringstream 的 成 员 函 数 str( ) 返回 由 输出 到 ostringstream 对 象 的 内 容 构 成 的 字符 串 。c_str( ) 是 
string 的 成 员 郑 数 ,， 它 返回 很 多 系统 接口 所 要 求 的 C 风格 字符 串 。 

stringstream 通常 用 于 将 真实 VO 和 数据 处 理 分 离 。 例如 ，str_to_double( ) 的 string 参数 通常 来 
自 一 个 文件 (比如 , 一 个 Web 日 志 ) 或 键盘 。 类 似 地 , 我 们 在 my_code( ) 中 生成 的 消息 最 终 会 输出 
到 屏幕 的 某 个 区 域 。 再 如 , 在 11.7 节 中 , 我 们 使 用 stringstream 来 过 滤 输 入 中 不 希望 出 现 的 字符 。 
因此 ，stringstream 可 以 看 做 一 种 剪裁 /O 以 适应 等 殊 第 求 和 偏好 的 机 制 。 

ostringstream 的 一 个 简单 应 用 是 连接 字符 串 : 


int seq_no = get_next_number(); // get the number of a log file 
ostringstream name; 
name << "myfile” << seq_no; /e.g., myfile17 


ofstream logfile(name.str().c_str));  //e.g., open myfile17 
通常 情况 下 , 我 们 用 一 个 string 来 初始 化 istringstream,， 然后 用 输入 操作 从 该 字符 串 中 读 取 字符 。 相 
反 , 我 们 通常 用 一 个 空 字符 串 初始 化 ostringstream, 然后 用 输出 操作 向 其 中 填 人 字符 。 有 一 种 更 为 直 
接 的 方法 来 访问 stringstream 中 的 字符 ; ss. str( ) 返 回 ss 的 字符 串 的 一 个 找 贝 ， 而 ss. str(s) 则 将 ss 的 
字符 串 设置 为 s 的 一 个 拷贝 。 这 种 方法 某 些 情况 下 很 有 用 , 11.7 节 展示 了 一 个 使 用 ss. str(s) 的 例子 ， 
体现 了 它 的 用 处 。 


11.5 面向 行 的 输入 


>> 操作 符 按 照 对 象 类 型 的 标准 格式 读 取 输 入 , 保存 到 对 象 中 。 例 如 ， 当 读 取 一 个 int 型 对 象 
时 ，>> 会 一 直 读 取 数 字 ,， 直 至 遇 到 一 个 非 数 字 的 字符 为 止 ; 当 读 取 一 个 string 时 ，>> 会 一 直 读 取 
字符 , 直至 遇 到 空白 符 为 止 。 标 准 库 istream 库 也 提供 了 读 取 单个 字符 和 整 行 1] 内容 的 功能 。 考虑 
下 面 的 代码 , 它 显然 没 有 达到 我 们 预想 的 效果 : 


string name; 
cin >> name; // input: Dennis Ritchie 
cout << name <<"\n'’; /output: Dennis 


如 果 希 望 一 次 读 取 整 行内 容 , 随后 再 决定 如 何 从 中 格式 化 输入 数据 , 我 们 应 该 怎么 做 呢 ? 可 以 使 
用 消 数 getline( )， 例 如: 


string name; 
getline(cin,name); // input: Dennis Ritchie 
cout<<name<<"\n'’;  / output: Dennis Ritchie 


现在 我 们 已 经 获得 整 行内 容 了 。 我 们 为 什么 要 这 么 做 呢 ? 一 个 很 好 的 答案 是 :“ 因 为 我 们 需要 做 
一 些 >> 做 不 了 的 事 。" 通 常 ,一 个 不 好 的 答案 是 :“ 因 为 用 户 输入 的 就 是 一 整 行 。 ”如果 你 能 想到 的 
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使 用 get_line( ) 的 最 佳 理 由 只 是 第 二 个 答案 的 话 , 还 是 继续 使 用 >> 吧 , 因为 一 旦 恋人 了 一 整 行 ， 
通常 情况 下 你 就 必须 自己 来 分 析 输 入 内 容 , 例如 : 


string first_name; 
string second_name; 


stringstream ss(name); 
ss>>first_name; / input Dennis 
ss>>second_name; // input Ritchie 


显然 , 直接 用 >> 将 读 人 字符 串 , 存 人 first_name 和 second_name 更 简单 些 。 

使 用 整 行 输入 的 一 个 常见 原因 是 , 默认 的 空 日 符 不 符合 我 们 的 要 求 。 有 了 时, 我 们 可 能 需要 将 
换行 符 同 其 他 空 日 符 区 别 对 待 。 例 如 , 与 一 个 电脑 游戏 的 文本 交互 中 , 可 能 将 一 行 作 为 一 句 话 ， 
而 不 使 用 习惯 的 空白 符 。 


go left until you see a picture on the wall to your right 
remove the picture and open the door behind it. take the bag from there 


对 于 此 例 , 我 们 可 以 先 读 入 一 行 , 然后 从 中 提取 单个 单词 。 


string command; 
getline(cin,command); /read the line 


stringstream ss(command); 

vector<string> words; 

string s; 

while (ss>>s) words.push_back(s); //extract the individual words 


但 是 , 只 要 我 们 有 其 他 解决 方法 , 还 是 尽量 使 用 习惯 的 空白 符 (使 用 >> 读 取 输 入 ) 而 不 是 换行 (使 
用 整 行 输入 )。 


11.6 字符 分 类 


通常 , 我 们 按 习 惯 格式 读 入 整数、 浮 点 数 、 单 词 等 。 但 是 , 我 们 可 以 (有 时 是 必须 ) 在 更 低 
的 抽象 层 上 读 人 单个 字符 。 这 样 做 在 编程 上 需要 做 更 多 工作 , 但 我 们 能 对 输入 有 完全 的 控制 。 
回顾 一 下 表达 式 单 词 分 析 问 题 ( 参 见 7. 8. 2 节 ) , 假如 我 们 希望 将 1 +4 * x <= y/z*5 分 解 为 11 
个 单词 : 

1+4*x<=y/z*5 
我 们 可 以 用 >> 读 人 数值 , 但 试图 以 字符 串 类 型 读 人 标识 符 时 ， 就 会 导致 x< =y 被 作为 一 个 字符 
串 谈 入 (因为 < 和 = 不 是 空白 符 ) , z* 也 是 如 此 (因为 * 也 不 是 一 个 空白 符 ) 。 我 们 可 以 写 出 如 下 
代码 实现 正确 的 单词 分 解 


char ch; 
while (cin.get(ch)) { 
if (isspace(ch)){ Vifch is whitespace 
// do nothing (i.e., skip whitespace) 


} 
if (isdigit(ch)) { 
read a number 


} 
else if (isalpha(ch)) { 
/read an identifier 


} 
else { 

1 deal with operators 
} 


} 
盟 数 istream :: get( ) 读 入 单个 字符 , 赋予 它 的 参数 ,这样 不 跳 过 空白 符 。 与 >> 类 似 , get( ) 返 回 其 
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istream 对 象 的 引用 , 我 们 检测 其 状态 。 
当 我 们 采用 逐个 字符 读 取 方式 时 , 通常 需要 对 字符 进行 分 类 : 这 个 字符 是 数字 吗 ? 这 个 字符 
是 大 写字 母 吗 ? 等 等 。 下 面 是 实现 字符 分 类 的 标准 库 函 数 ， 


字符 分 类 

isspace( cj c 是 室 白 符 吗 (" 、\t 、\n 等 ) 

isalpha( ¢) c 是 字母 吗 (a'..z 、 AZ ) (注意 : 不 包括 '_) 
isdigit( c) c 是 十 进 制 数字 吗 (0 .9 ) 

isxdigit( ec) c 是 十 六 进 制 数 字 吗 ( 十进制 数字 或 'a.. 了 或 'A. .FF ) 
isupper(c) c 是 大 写字 母 吗 

islower( c) c 是 小 写字 母 吗 

isalnum( ec ) c 是 字母 或 十 进 制 数字 吗 

iacntrlf ce) c 是 控制 字符 吗 (ASCII 码 0..31 和 127) 

ispunct( ec) c 是 标点 ( 除 字母 、 数 字 、 空白 符 或 不 可 见 控制 字符 之 外 的 字符 ) 吗 
isprint( e) c 是 可 打印 字 特 吗 (ASCII 字符 "'.."~') 


isgraph( ©) c 是 字母 、 十 进 制 数字 或 标点 吗 (注意; 不 包括 空白 符 ) 
注意 , 多 个 字符 分 类 可 以 用 “或 "运算 符 (1) 进 行 组 合 。 例 如 , isalnum(c) 意 味 着 isalpha(c) lisdigit(c)， 


也 就 是 说 ,“e 是 一 个 字母 或 一 个 数字 吗 ? 
另外 , 标准 库 还 提供 了 另外 两 个 有 用 的 函数 , 用 来 转换 大 小 写 : 


字符 大 小 写 
toupper( ce ) ec 或 e 对 应 的 大 写字 母 
tolower( ec) ec 或 e 对 应 的 小 写字 母 


如 果 你 想 忽略 大 小 写 , 这 两 个 函数 很 有 用 。 例 如 , 用 户 输入 Right、 right 和 rigHT 很 可 能 是 想 表示 
相同 的 意思 (rigHT 很 可 能 是 不 小 心 误 按 了 Caps Lock 键 ) 。 对 这 些 字符 串 的 每 个 字符 都 应 用 tolow- 
er( ) 后 ,所 有 字符 串 都 变 为 了 right。 我 们 可 以 为 字符 串 定义 tolower 函数 : 
void tolower(string& sl) /putsinto lower case 
{ 
for (int i=0; ji<s.length()) ++i) s[i] = tolower(s[i]); 
} 


参数 传递 上 我 们 采用 了 传 引 用 方式 (参见 8. 5. 5 节 ), 以 便 函 数 能 真正 改变 实 参 字符 串 。 如 果 我 们 
希望 保持 原 字符 串 的 内 容 不 变 , 可 以 编写 一 个 函数 , 创建 原 字符 串 的 一 个 小 写 拷贝 。 在 处 理 这 类 
问题 时 , 使 用 tolower( ) 比 使 用 toupper( ) 更 好 些 。 因 为 对 于 某 些 自然 语言 (如 德语 ), 并 不 是 所 有 
小 写字 母 都 有 对 应 的 大 写字 母 , 因此 前 者 能 获得 更 好 的 效果 。 


11.7 使 用 非 标准 分 隔 符 


本 节 提 供 一 个 接近 实际 的 例子 , 它 使 用 iostream 库 解 决 一 个 真实 问题 。 当 我 们 读 人 字符 串 时 ， 
是 以 空白 符 作为 默认 分 隔 符 的 。 不 幸 的 是 , istream 没有 提供 自 定 义 分 隔 符 的 功能 , 也 不 能 直接 改 
变 >> 读 人 字符 串 的 方式 。 于 是 ,如 果 我 们 需要 定义 其 他 分 隔 符 , 应 该 怎么 做 呢 ? 回顾 4. 6. 3 节 中 
的 例子 , 在 那个 例子 中 , 我 们 读 人 “单词 "并 进行 比较 。 那 些 单词 都 是 以 空白 符 分 隔 的 , 因此 ,如 
果 我 们 输入 z 

As planned, the guests arrived; then, 
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我 们 会 得 到 这 些 “ 单词”: 
As 
planned, 
the 
guests 
arrived ， 
then, 


对 于 "planned,， 和 ”arived; “， 我 们 在 字典 中 是 找 不 到 这 些 字符 串 的 ,它们 并 不 是 单词 。 它 们 实 
际 上 是 由 单词 加 上 瞩 无 关系 的 、 分散 注意 力 的 标点 字符 构成 的 。 而 在 大 多 数 场 合 下 , 我 们 是 应 该 
将 标点 与 空白 符 等 同 对 待 的。 那么 该 如 何 去 掉 这 些 标 点 呢 ? 我 们 可 以 逐个 处 理 字符 , 将 标点 字符 
删除 或 者 转换 为 空 日 符 ， 随 后 再 从 ”清理 干 奖 的 “输入 中 该 取 数 据 : 


string line; 
getline(cin,line); // read into line 
for (int i=0; i<line.size(); ++i) // replace each punctuation character 
/by a space 
switch(lineli]) { 


Case ';': Case '.': Case ',': Case '3': case '!': 
linelij='"; 


} 
stringstream ss(line);. // make an istream ss reading from line 
vector<string> vs; 
string word; 
while (ss>>word) H read words without punctuation characters 


vs.push_back(word); 
同样 是 前 面 给 出 的 输入 , 这 段 代 码 会 得 到 如 下 单词 ; 


不 幸 的 是 ,这 段 代码 有 些 乱 ， 而 且 是 专用 而 非 通用 的 。 如 果 对 另外 一 个 问题 ,标点 集 发 生变 
化 ,我们 又 该 怎么 办 呢 ? 下 面 我 们 提出 一 种 更 为 通用 、 更 为 有 效 的 从 输入 流 中 删除 不 需要 字符 
的 方法 。 这 种 方法 应 该 是 怎么 样 的 呢 ? 我 们 希望 使 用 这 一 功能 的 用 户 程序 是 什么 样 的 呢 ? 考 
虑 下 面 的 代码 : 


ps.whitespace(";:,."); /treat semicolon colon comma, and dot as whitespace 
string word; 
while (ps>>word) vs.push_back(word); 


我 们 如 何 才能 定义 一 个 像 ps 这 样 的 流 呢 ? 基本 思想 是 先 从 一 个 普通 输入 流 读 人 单词 ,然后 使 用 
用 户 指定 的 “空白 符 ” 来 处 理 输入 内 容 , 也 就 是 说 , 我 们 并 不 将 “空白 符 ” 交 给 用 户 , 我 们 只 是 用 它 
们 来 分 隔 单词 。 例 如 


as.not 
应 该 是 两 个 单词 
0 | 


我 们 可 以 定义 一 个 类 来 实现 上 述 功 能 。 这 个 类 必须 从 一 个 istream 读 取 数 据 , 而 且 要 有 一 个 >> 操 
作 符 , 能 像 istream 一 样 工作 , 唯一 的 差别 是 我 们 可 以 告知 它 哪些 字符 作为 空 日 符 。 简 单 起 见 , 我 
们 不 支持 默认 空白 符 ( 空 格 、 换 行 等 )。 也 就 是 说 , 我 们 只 允许 用 户 指定 非 标准 的 空白 符 。 我 们 也 
不 提供 从 输入 流 中 完全 删除 指定 字符 的 功能 ,只 是 将 它们 转换 为 标准 空 握 符 。 我 们 将 这 个 类 命名 
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为 Punct_stream ， 


class Punct_stream { // like an istream, but the user can add to 
// the set of whitespace characters 
public: 
Punct_stream(istreame& is) 
: source(is), sensitive(true) { } 


void whitespace(const string& s)  //make s the whitespace set 
{white = s; } 

void add_white(char c) {white +=c; }  //add to the whitespace set 

bool is_whitespace(char ©); /is Cc in the whitespace set? 


void case_sensitive(boo! b) { sensitive = b; } 
bool is_case_sensitive() { return sensitive; } 


Punct_stream& operator>>(string& $s); 


operator bool(); 

private: 
jstream& source; // character source 
istringstream buffer; //we let buffer do our formatting 
string white; // characters considered “whitespace” 
bool sensitive; // is the stream case-sensitive? 


»; 
如 上 面 示例 代码 所 示 , 基本 思想 是 从 istream 中 一 一 次 读 取 一 行 ,将 指定 的 空白 符 转 换 为 空格 , 然后 
使 用 istringstream 完成 格式 化 。 除 了 处 理 用 户 自 定义 空白 符 外 , 我 们 还 为 Punct_stream 实现 了 一 个 
相关 的 功能 : 我 们 可 以 通过 case_sensitive( ) 要 求 它 将 大 小 写 敏感 的 输入 转换 为 大 小 写 不 敏感 的 输 
入 。 例 如 , 我 们 可 以 要 求 Punct_stream 将 

Man bites dog! 


转换 为 


man 
bites 
dog 


Punct_stream 的 构造 函数 接受 一 个 istream 参数 作为 字符 输入 源 , 并 将 其 命名 为 source。 构造 函数 
还 将 流 默 认 设 置 为 大 小 写 敏感 的 。 下 面 代 码 可 以 令 Punct_steam 从 cin 恋人 字符， 将 分 号、 冒号 
和 点 作为 空白 符 , 并 将 所 有 字符 转换 为 小 写 : 


Punct_stream ps(cin); /i ps reads from cin 
ps.whitespace(";:."); // semicolon, colon, and dot are ajso whitespace 
ps.case_sensitive(false);  //not case-sensitive 


显然 , 最 有 趣 的 操作 是 输入 操作 符 >>, 这 也 是 目前 为 止 最 难于 实现 的 。 基本 策略 是 从 istream 读 
取 一 整 行 , 存 人 一 个 名 为 line 的 字符 串 ， 然后 将 所 有 自 定义 空白 符 转换 为 空格 符 ''。 完 成 后 , 我 
们 将 line 放 入 名 为 buffer 的 istringstream。 现 在 就 可 以 使 用 识别 一 般 空 白 符 的 >> 从 ， buffer 中 读 取 
数据 了 。 实 际 代码 比 上 述 过 程 稍微 复杂 一 些 , 因为 从 buffer 中 读 取 数据 直接 就 可 以 进行 , 但 只 有 
在 它 为 空 的 情况 下 , 才能 向 其 写 人 内 容 。 —- / 


Punct_stream& Punct_stream: :operator>>(string& s) 
{ 。 


while (Ii(buffer>>s) { /try to read from buffer 
if (buffer.bad( || 1source.goo0d()) return tnts; 
buffer.clear(); 


string line; 
getline(source,line); // get a jine from source 
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// do character replacement as needed: 
for (int i =0; i<line.size(); ++i) 
if (is_whitespacelline[i])) 
line[li]=" "; /to space 
else if (!sensitive) 
line[li] = tolower(line[i]); // to lower case 


buffer.str(line); Hf put string into stream 
} 
return *this; 
} 
我 们 逐 行 分 析 一 下 这 段 程序 。 先 看 一 下 这 行 有 点 不 寻常 的 代码 
while (1(buffer>>s)) { 


如 果 名 为 buffer 的 istringstream 中 存 有 字符 , 读 操 作 buffer >> s 就 可 以 进行 ,s 会 收 到 以 “空白 符 ” 
分 隔 的 单词 ， 随 后 就 没有 什么 可 做 的 了 。 只 要 buffer 中 有 我 们 可 以 读 取 的 字符 , 这 个 过 程 就 会 发 
生 。 但是, 当 buffer >> s 失败 时 , 也 就 是 ! (buffer >> s) 为 真 时 , 我 们 必须 利用 source 中 的 内 容 将 
buffer 重新 填 满 。 注 意 读 操 作 buffer >> s 是 在 一 个 循环 中 , 因此 当 我 们 尝试 重新 填充 buffer 后 ,会 


再 次 尝试 这 个 读 操 作 ,， 因 此 有 如 下 代码 : 


while (!(buffer>>s)) { Vitrytoread from buffer 
if (buffer,bad() | 1source.good()) return *this; 
buffer.clear(); 


/ replenish buffer 
到 
如 采 buffer 处 于 bad( ) 状态 , 或 者 source 有 问题 的 话 , 我 们 将 放弃 读 取 操作 。 否 则 , 清空 buffer, 再 
次 尝试 。 清 空 buffer 的 原因 是 ， 只 有 在 读 失 败 的 情况 下 , 通常 是 buffer 遇 到 eof( ) 时 , 我 们 才 进 入 
“重新 填充 循环 ”, 而 这 意味 着 buffer 中 没有 供 我 们 读 取 的 字符 。 处 理 流 状态 总 是 很 麻烦 的 , 而 且 
常常 是 微妙 错误 的 根源 , 需要 元 长 的 调试 过 程 来 消除 。 幸 运 的 是 , 重 填 循 环 的 剩余 部 分 很 简单 : 


string line; 
getline(source,line); // geta line from source 


/ do character replacement as needed: 
for (int i =0; ji<jine.size(); ++i) 
if (is_whitespace(line[i))) 
line[i]= ' ’'; /to space 
else if (!sensitive) | 
line[i] = tolower(line[i]); // to lower case 


buffer.str(line); / put string into stream 

我 们 先 读 入 一 整 行 到 line, 然后 检查 其 中 的 每 个 字符 , 看 是 否 需 要 改变 。is_whitespace( ) 是 Punct_ 
stream 的 成 员 函 数 , 我 们 随后 再 定义 它 。tolower( ) 是 标准 库 函 数 ,， 其 功能 显然 是 将 字母 转换 为 小 
写 , 如 将 A 转换 为 a( 参 见 11.6 节 )。 

一 旦 我 们 正确 处 理 完 line 中 的 内 容 ， 就 需要 将 其 存 人 istringstream。 buffer. str( line ) 完成 这 一 
工作 , 这 条 语句 可 以 读 做 “将 istringstream 对 象 buffer 的 字符 串 值 设置 为 line 的 内 容 ”。 

注意 , 使 用 getline( ) 从 source 读 和 一行 字符 后 , 我 们 “忘记 了 ”检测 它 的 状态 。 实 际 上 不 必 那 
么 做 , 原因 是 我 们 最 终 会 到 达 位 于 循环 顶部 的 ! source. good( ) 语 句 , 这 时 就 会 进行 检测 了 。 


这 里 我 们 仍然 将 流 自身 的 引用 一 一 this 作为 >> 的 返回 结果 , 参见 17. 10 节 。 
测试 空白 符 的 部 分 很 容易 实现 , 我 们 只 需 将 输入 字符 与 所 有 指定 空白 符 一 一 进行 比较 即 可 : 
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bool Punct_stream::is_whitespace(char c) 
for (int i = 0; ji<white.size(0); ++i) if (c==white[i]) return true; 
return false; 

} 


记 住 , 我 们 将 处 理 上 默认 空白 符 ( 如 换行 和 空格 ) 的 工作 留 给 istringstream 来 做 了 ， 因 此 我 们 无 需 对 
这 类 空白 符 做 特殊 处 理 。 

只 剩 下 一 个 神秘 的 肾 数 了 : 

Punct_stream: :operator bool() 

《 


return i(source.fail() || source.bad0) && source.good(); 
} 


istream 的 一 种 习惯 用 法 是 测试 >> 的 结果 , 例如 : 

while (ps>>s) {/* ...*/} 
这 意味 着 我 们 需要 一 种 方法 将 ps >> s 的 结果 当做 布尔 值 来 进行 检查 。 但 ps >>s 的 结果 是 一 个 
Punct_stream ， 因 此 我 们 需要 一 种 方法 将 Punct_stream 隐 式 转换 为 bool 值 。 这 就 是 Punct_stream 的 
operator bool( ) 所 做 的 事情 。Punct_stream 的 名 为 operator bool( ) 的 成 员 函 数 定 义 了 流 到 bool 类 型 
的 转换 。 特 别 地 ,， 它 在 Punct_stream 上 的 操作 成 功 时 返回 true。 

现在 我 们 就 可 以 写 程序 来 测试 Punct_steam 类 了 。 


int main() 
// given text input, produce a sorted list of all words in that text 
// ignore punctuation and case differences 
// eliminate duplicates from the output 


《 
Punct_stream ps(cin); 
ps.whitespace(" 7 人 ON 人 cy&SGH9A ~ ) 1 note \" means " in string 
ps.case_sensitive(false); 
cout << "please enter words\n"; 
vector<string> vs; 
string word; 
while (ps>>word) vs.push_back(word); //read words 
sort(vs.begin(),vs.end()); // sort in lexicographical order 
for (int i=0; i<vs.size(); ++i) // write dictionary 
if (1==0 || vs[i]!=vs{i—1)) cout << vs[ << endl; 
} 


这 个 程序 会 将 输入 中 出 现 的 单词 排序 输出 。 测 试 语句 


if (i==0 || vsfi]!=vs[i~1]) 
会 去 除 重复 单词 。 试 一 试 给 这 个 程序 下 面 的 输入 内 容 : 


There are only two kinds of languages: languages that people complain 
about and languages that people don't use. 


程序 会 输出 


and 

are 
complain 
don’t 
languages 
of 

only 
people 
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that 
there 
two 
use 


为 什么 会 得 到 don’t 而 不 是 dont 呢 ? 因为 我 们 并 没有 将 单 引号 指定 为 空白 符 。 

”注意 , Punct_stream 在 很 多 重要 的 方面 都 与 istream 相似 , 但 它 的 确 不 是 istream。 例 如 ,我们 
不 能 使 用 rdstate( ) 来 获取 流 状态 ，eof ( ) 也 没有 定义 , 而 且 我 们 也 不 必 为 针对 整数 的 >> 而 烦恼 
( Punct_stream 只 是 用 来 处 理 字符 串 的 ) 。 重 要 的 是 , 对 于 一 个 期 望 istream 参数 的 函数 ,我 们 不 能 
将 Punct_stream 传递 给 它 。 我 们 可 以 使 Punct_stream 真 的 成 为 istream 吗 ? 当然 可 以 , 但 现在 我 们 
所 拥有 的 编程 经 验 、 设计 思想 和 语言 工具 还 不 足以 实现 这 一 目标 (如 果 你 以 后 希望 回 过 头 再 来 完 
成 这 个 目标 一 一 当然 是 很 入 以 后 的 事情 , 你 还 必须 从 某 些 专 家 水 平 的 指南 或 手册 中 深入 学 习 流 组 
冲 相关 的 内 容 ) 。 

你 是 否 发 现 Punct_stream 的 代码 很 易 读 ? 是 否 注意 到 注释 很 容易 理解 ?9 你 是 否认 为 你 自己 也 
能 编写 这 些 代码 ? 如 果 你 几 天 前 还 是 一 个 真正 的 初学 者 , 诚实 的 回答 应 该 是 “不 ! 不 ! 不 1” 其 至 
是 “不 ! 不 ! 绝 不 可 能 !! 你 疯 了 吗 ? 我 们 理解 你 的 想法 ,但 是 对 于 最 后 一 个 疑问 ,回答 确实 是 
“不 , 至 少 我 们 认为 不 可 能 ”。 我 们 给 出 本 例 的 目的 是 : 

e 展示 一 个 相对 实际 的 问题 和 解决 方案 。 

e 展示 用 相对 适中 的 方法 能 达到 什么 样 的 结果 。 

e 对 于 一 个 显然 较为 简单 的 问题 , 给 出 一 个 易于 使 用 的 解决 方案 。 

e 说 明 接 口 和 实现 之 间 的 差别 。 
为 了 成 为 一 名 程序 员 ,你 需要 阅读 真实 代码 ， 而 不 仅仅 是 用 于 教学 的 “精致 的 "解决 方案 。 我 们 给 
出 这 个 例子 就 是 出 于 这 个 目的 。 过 了 几 天 或 几 周 后 , 这 个 程序 对 你 来 说 就 会 很 容易 理解 了 ,你 就 
可 以 考虑 改进 它 了 。 

我 们 可 以 这 样 看 待 这 个 例子 , 它 就 相当 于 教师 在 英语 初学 者 课 上 讲授 了 一 些 真正 的 英语 倡 
语 , 为 课程 增加 了 一 些 色彩 , 活跃 了 学 习气 氛 。 


11.8 还 有 很 多 未 讨论 的 内 容 


VO 相关 的 细节 问题 看 上 去 是 无 穷 无 尺 的 , 因为 它们 只 受 限于 人 类 的 创造 力 和 想象 力 。 这 就 
如 同 我 们 无 法 想象 自然 语言 有 多 复杂 一 样 。 英 语 中 的 12. 35 按 大 多 数 其 他 欧洲 语言 的 习惯 应 该 表 
示 为 12, 35。 自 然 地 ,C++ 标准 库 提供 了 处 理 这 一 问题 以 及 其 他 很 多 自然 语言 相关 的 VO 问题 的 
功能 。 但 是 , 你 如 何 输出 中 文 符号 呢 ?” 你 如 何 比 较 两 个 马 拉 亚 拉 姆 语 字 符 串 呢 ?” 这 些 间 题 已 经 有 
解决 方案 了 , 但 这 些 内 容 远 远 超 出 了 本 书 的 讨论 范围 。 如 果 你 对 此 感 兴趣 ， 请 参考 更 为 专门 的 或 
高 阶 的 书籍 (如 Langer 的 《Standard C++ IOStreams and Locales》 和 Stroustrmp 的 《The C++ Program- 
ming Language》) ， 以 及 标准 库 和 系统 的 文档 。 请 搜索 “本 地 化 ”(locale) 一 词 ， 这 个 术语 通常 用 于 
描述 处 理 目 然 语言 差异 的 程序 设计 语言 特性 。 

另 一 个 复杂 性 之 源 是 缓冲 机 制 : 标准 库 iostream 依赖 于 一 个 称 为 streambuf 的 机 制 。 对 于 那些 
高 端的 应 用 (无 论 是 从 性 能 角度 还 是 从 功能 角度 ) ,都 不 可 避免 地 会 用 到 streambuf。 如 果 你 觉得 需 
要 定义 自己 的 iostream, 或 者 需要 调整 iostream 用 于 新 的 数据 源 / 目 的 , 参见 Stroustmp 的 《The 
C++ Programming Language》 第 21 章 或 系统 文档 。 

当 使 用 C++ 时, 你 也 可 能 会 遇 到 以 printf( )/scanf( ) 为 代表 的 C 语言 标准 VO 函数 族 。 如 果 
你 希望 了 解 这 部 分 内 容 , 请 参考 27. 6 节 和 附录 B. 10. 2, 或 者 参考 Kermighan 和 Ritchie 所 编写 的 优 
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秀 的 C 语言 教材 (The C Programming Language》 ， 以 及 互联 网 上 数 不 清 的 资源 所 每 种 程序 设计 语言 
都 有 其 自己 的 VO 机 制 , 各 不 相同 , 有 的 很 古怪 , 但 大 多 数 都 ( 以 不 同方 式 ) 反 映 了 我 们 在 第 10 章 
和 第 11 章 中 所 介绍 的 基本 思想 。 


附录 B 总 结 了 C++ 标准 库 的 VO 机 制 。 
图 形 用 户 接口 (GUI) 相关 的 话题 将 在 第 12 ~ 16 章 进行 介绍 。 


<》 简单 练习 


9. 


10. 


. 开始 编写 一 个 名 为 Test_output. cpp 的 程序 。 声 明 一 个 整数 birth_year, 并 将 你 的 出 生年 份 赋予 它 。 
， 以 十 进 制 、 十 六 进 制 和 八进制 格式 输出 birth_year。 

， 标 出 每 个 输出 值 所 用 的 基底 的 名 字 。 

.使 用 制 表 符 将 输出 定位 到 适当 的 列 上 。 

. 现在 输出 你 的 年 龄 。 

. 现在 有 什么 问题 吗 ? 发 生 什 么 情况 了 ? 将 输出 固定 为 十 进 制 。 

. 返回 第 2 题 , 让 输出 的 每 个 值 都 显示 基底 。 

， 党 试 读 人 八进制 数 、 十 六 进 制 数 ， 等 等 ， 


cin >> a >>0ct >> b >> hex >> c >> d; 
cout <<a<e< ee bae Me cae Wee d <e Mn'; 


运行 程序 , 输入 下 面 内 容 
1234 1234 1234 1234 


解释 输出 结果 。 

编写 程序 , 分 别 以 general、fixed 和 scientific 格式 输出 浮 点 数 1234567. 89。 哪 种 格式 呈现 给 用 户 最 精确 的 
表示 ? 解释 为 什么 。 

创建 一 个 简单 的 表格 , 包含 你 和 至 少 5 位 朋友 的 姓 、 名、 电话 号 码 和 电子 邮件 地 址 。 试 验 不 同 的 域 宽 ， 
直至 表格 的 输出 满足 你 的 需求 为 止 。 


<》 思考 题 


= 
Cs 


.为 什么 WO 对 于 程序 员 来 说 有 些 理 手 ? 

,符号 << hex 的 作用 是 什么 ? 

. 十 六 进 制 数 在 计算 机 科学 中 的 作用 是 什么 9 为 什么 ? 

.为 你 想 实现 的 几 个 整数 输出 格式 化 选项 命名 。 

. 什么 是 操纵 符 ? 

. 十 进 制 数 的 前 组 是 什么 ”八进制 呢 ? 十 六 进 制 呢 ? 

. 浮 点 数值 的 默认 输出 格式 是 什么 ? 

. 什么 是 域 ? 

.解释 setprecision( ) 和 setw( ) 的 作用 。 

. 文件 打开 模式 的 目的 是 什么 ? 

. 下 面 哪个 操纵 符 不 是 持久 的 ; hex、scientific、setprecision 、showbase 、setw? 
， 字 符 串 WO 和 二 进 制 LO 的 差异 在 哪里 ? 

.给 出 一 个 例子 , 使 用 二 进 制 文件 比 使 用 文本 文件 更 好 。 

.给 出 两 个 例子 , 说 明 stringstream 的 用 途 。 
,什么 是 文件 定位 ? 

.如 果 你 试图 定位 到 文件 尾 之 后 , 会 出 现 什么 结果 ? 

， 什么 情况 下 , 使 用 面向 行 的 输入 比 面向 类 型 的 输入 更 好 ? 
.isalnum(c) 的 功能 是 什么 ? 
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二 进 制 十 六 进 制 八进制 字符 分 类 无 规律 输出 格式 
十 进 制 面向 行 的 输入 有 规律 文件 定位 操纵 符 scientific 
fixed 非 标 准 分 隔 符 setprecision general noshowbase showbase 
<》 习题 


1 
2 


a nh 


编写 程序 , 读 取 一 个 文本 文件 , 将 其 中 的 字母 都 转换 为 小 写 , 生成 一 个 新 文件 。 
编写 程序 , 将 文件 中 的 元 音 都 删除 ( ”disemvowels ， 只 写 辅音 的 输入 方式 )。 例 如 , 将 “Once upon a time!” 
转换 为 “nc pn tm1”。 令 人 惊奇 的 是 , 通常 得 到 的 结果 还 是 可 读 的 。 请 你 的 朋友 测试 这 个 程序 。 


. 编写 一 个 名 为 multi_input cpp 的 程序 , 提示 用 户 输入 几 个 整数 , 可 以 使 用 不 同 的 数 制 , 对 八进制 和 十 六 进 


制 分 别 使 用 0 和 0x 前 级 进行 输入 。 程 序 能 正确 解释 这 些 数值 , 并 将 它们 转换 为 十 进 制 格式 。 随 后 输出 这 


些 数值 ， 如 下 图 所 示 , 列 对 齐 : 

0x4 hexadecimal convertsto 67 decimal 
0123 octal convertsto 83 decimal 
65 decimal convertsto 65 decimal 


. 编号 程序 , 读 入 一 些 字符 串 , 对 每 个 字符 串 , 输出 其 中 每 个 字符 的 分 类 , 字符 分 类 方式 和 分 类 函数 如 11.6 


节 所 述 。 注 意 , 一 个 字符 可 能 属于 多 个 类 别 (如 x 既是 字母 义 是 字母 数字 )。 


.编写 程序 , 将 输入 中 的 标点 转换 为 空 日 符 。 例 如 ,，“ -don't use the as -这 mle. ”转换 为 “dont use the asif mle” 。 
， 修改 习题 5 中 的 程序 , 将 don’t 转换 为 do not, can't 转换 为 can not, 等 等 , 在 单词 内 的 标点 保持 不 变 ( 于 


是 上 题 中 的 输入 会 转换 为 “do not use the as-if mle”)。 


. 编写 程序 , 利用 上 题 的 程序 生成 字典 (替代 11.7 节 中 的 方法 ) 。 对 一 个 多 页 的 文本 文件 运行 程序 , 观察 结 


果 是 否 还 有 改进 的 余地 。 


. 将 11.3.2 节 中 的 二 进 制 VO 程序 一 分 为 二 : 一 个 程序 将 原始 文本 文件 转换 为 二 进 制 , 男 一 个 程序 读 入 二 


进 制 文件 , 将 其 转换 为 文本 格式 。 测 试 这 两 个 程序 : 对 一 个 文本 文件 进行 这 两 个 步骤 的 转换 , 将 结果 与 
原始 文件 进行 比较 。 


， 编写 困 数 vector < string > split( const string& s), 将 s 中 以 空白 符 分 隔 的 子 串 存 人 向 量 , 作为 结果 返回 。 
， 编 写 晃 数 vector < string > split( const string& s，const string& w) , 与 上 题 的 split 函数 相 比 ,新 的 split 函数 


除了 默认 的 空白 符 外 , 还 将 w 中 的 字符 当做 空白 符 。 


. 编写 程序 , 将 一 个 文本 文件 中 的 字符 颠倒 顺序 。 例 如 ”asdfghjkl” 转换 为 “lkjhgfdsa”。 提 示 : 文件 打开 模式 。 
. 编写 程序 , 将 一 个 文件 中 单词 (空白 符 间 隔 的 字符 串 ) 的 顺序 颠倒 过 来 。 例 如 , 将 Norwegian Blue parrot 


转换 为 parrot Blue Norwegian。 你 可 以 假定 内 存 空间 可 以 容纳 文件 中 的 所 有 字符 串 。 


. 编写 程序 , 读 取 一 个 文本 文件 , 输出 文件 中 包含 不 同类 别 字符 的 个 数 , 字符 类 别 定义 如 11.6 节 所 述 。 
. 编写 程序 , 读 取 一 个 文件 , 文件 格式 是 以 空白 符 间隔 的 数值 ,将 这 些 数值 输出 到 另 一 个 文件 , 格式 采用 


科学 记 数 法 , 精度 为 8, 每 行 4 个 域 , 每 个 域 的 宽度 为 20 个 字符 。 


. 编写 程序 , 读 取 一 个 以 空白 符 间 隔 的 数值 文件 , 按 升序 输出 这 些 数值 , 每 行 一 个 值 。 每 个 数值 只 输出 一 次 , 如 


果 一 个 数值 在 原文 件 中 出 现 多 次 , 同时 输出 它 出 现 的 次 数 。 例 如 , 车 原文 件 为 “7 5573 117 5”, 则 输出 : 
3 


5 3 
7 2 
117 


<》 附 言 


输入 /输出 是 很 难处 理 的 , 因为 我 们 人 类 的 喜好 和 习惯 并 不 遵从 简单 的 、 易 于 阐述 的 原则 和 直接 的 数学 


法 则 。 作 为 程序 员 , 我 们 几乎 不 可 能 命令 用 户 偏离 他 自己 的 习惯 和 偏好 ; 即便 我 们 可 以 , 最 好 也 不 要 过 于 自 
大 , 以 至 于 认为 我 们 可 以 提供 一 种 简单 方式 , 来 替代 入 类 于 百年 来 形成 的 习惯 。 因 此 , 我 们 必须 预计 到 输 
人 /输出 中 所 面临 的 一 定 程 度 上 的 混乱 , 并 接受 它 、 适 应 它 。 与 此 同时 , 还 要 尽力 保持 我 们 程序 的 简洁 一 一 
但 不 要 过 度 简 单 化 。 


第 12 章 一 个 显示 模型 


“直到 20 世纪 30 年 代 , 世界 才 变 成 彩色 的 。 


——Calvin’ s dad 


本 章 描 述 了 一 个 显示 模型 (GUI 的 输出 部 分 ), 并 给 出 了 使 用 方法 和 一 些 基 本 概念 , 如 屏幕 坐 
标 、 线 和 颜色 等 。Shape 是 内 存 中 的 一 个 对 象 ,我们 可 以 将 其 显示 在 屏幕 上 并 进行 适当 的 操作 。 
Line、Lines 、Polygon 、Axis 和 Text 都 是 Shape 的 实例 。 后 面 两 章 将 进一步 探讨 这 些 类 , 第 13 章 便 
重 类 的 实现 , 第 14 章 侧重 设计 问题 。 


12. 1 


为 什么 要 使 用 图 形 用 户 界 面 


我 们 为 什么 用 四 章 篇 幅 介绍 图 形 并 用 一 章 介 绍 GUI( 图形 用 户 接口 ) 呢 ? 毕竟 本 书 是 一 本 程 
序 设计 书籍 ,而 非 图 形 学 书籍 。 实 际 上 有 很 多 非常 有 趣 的 软件 设计 的 话题 , 我 们 无 法 一 一 讨论 ， 
在 这 里 只 是 介绍 与 图 形 有 关 的 内 容 。 那 么 , 为 什么 要 选择 图 形 这 个 话题 呢 ? 从 本 质 上 讲 ， 图 形 学 
是 一 个 学 科 , 在 其 学 习 过 程 中 , 我 们 可 以 对 软件 设计 、 程序 设计 及 其 语言 特性 等 重要 的 领域 进行 
深入 的 探讨 。 z 


图 形 很 有 用 。 虽 然 使 用 GUI, 更 多 工作 仍 在 于 程序 设计 而 非 图 形 , 软件 设计 仍 比 编写 代码 
更 重要 。 但 是 , 图 形 在 很 多 领域 都 非常 重要 , 例如 , 对 于 科学 计算 、 数 据 分 析 或 者 任何 一 
个 量化 问题 , 没有 数据 图 形 化 功能 是 不 可 想象 的 。 第 15 章 给 出 了 一 个 简单 通用 的 数据 图 
形 化 工具 。 

图 形 很 有 趣 。 在 多 数 计算 领域 中 , 一 段 代 码 的 效果 是 很 难 立刻 呈现 出 来 的 ,即便 最 后 代码 
没有 bug 了 , 也 无 法 立刻 看 出 来 。 这 时 , 即使 图 形 没 有 用 , 我 们 也 会 倾向 于 使 用 图 形 界 面 
来 获得 即时 效果 。 

图 形 提供 了 许多 有 趣 的 代码 。 通 过 阅读 大 量程 序 代 码 , 可 以 找到 一 种 对 代码 好 坏 的 判断 标 
准 , 就 像 写 好 英文 文章 必须 要 阅读 大 量 书 籍 、 文 章 和 高 质量 的 报纸 一 样 。 由 于 程序 代码 与 屏 
幕 显示 有 某 种 直接 关系 , 图 形 代 码 比 复杂 程度 接近 的 其 他 类 别 的 代码 更 易于 阅读 。 经 过 本 章 
几 分 钟 的 介绍 你 就 能 够 阅读 图 形 代码 , 再 经 过 第 13 章 的 学 习 就 能 编写 图 形 代码 。 

图 形 设计 实例 非常 丰富 。 实 际 上 , 设计 和 实现 一 个 好 的 图 形 和 GUI 库 是 很 困难 的 。 图 形 
领域 中 有 非常 丰富 的 具体 的 、 贴 近 实际 的 例子 , 可 供 学 习 设 计策 略 和 设计 技术 。 通 过 相对 
较 少 的 图 形 和 GUI 代码 , 就 能 展示 包括 类 的 设计 、 函 数 的 设计 、 软 件 分 层 ( 抽 象 ) 、 库 的 创 
建 等 在 内 的 许多 技术 。 

图 形 有 利于 解释 面向 对 象 程序 设计 的 概念 及 其 语言 特征 。 与 流言 相反 的 是 , 面向 对 象 程 
序 最 初 并 不 是 为 了 图 形 化 应 用 所 设计 的 (参见 第 22 章 ), 但 它 确实 很 快 就 应 用 到 图 形 领域 
中 , 而 且 图 形 化 应 用 提供 了 一 些 非常 易于 理解 的 面向 对 象 设计 实例 。 

一 些 关 键 的 图 形 学 概念 非常 重要 ， 而 且 不 是 那么 简单 直 白 的 。 因 此 应 该 在 教学 中 进行 讲 
授 , 而 不 是 靠 自 己 的 主动 性 (以 及 耐心 ) 去 学 习 理解 。 如 果 我 们 不 展示 图 形 和 GUI 程序 的 
实现 方法 , 你 可 能 会 认为 它们 是 不 可 思议 的 魔法 , 这 显然 偏离 了 本 书 的 一 个 基本 目标 。 
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12. 2 一 个 显示 模型 


iostream 库 是 面向 字符 的 输入 /输出 流 , 用 于 处 理 数值 序列 或 者 书籍 的 文本 最 为 适合 。 其 中 ， 
newline 和 tab 控制 字符 是 仅 有 对 图 形 位 置 概念 的 直接 的 支持 。 现 有 的 版 面 设计 语言 (排版 语言 、 
“标注 语言 ”) ,如 Troff、Tex、Word、HTML、XML( 及 其 配套 的 图 形 包 ) , 允许 在 一 维 字符 流 中 其 人 
颜色 和 二 维 位 置 等 概念 。 例 如 ; 


<hr> 

<h2> 

Organization 

<h2> 

This list is organized in three parts: 

<ub> 
<li><b>pProposals<b>, numbered EPddd, . . .</li> 
<lic<b>lssues</b>, numbered Elddd, .. .</li> 
<ii><b>Suggestions</b>, numbered ESddd, . . .</li> 

</ub> 

<p>We try to . . ， 

<p> 


这 段 HTML 代码 指定 了 一 个 文档 头 ( <h2 > … </h2 > ) 、 一 个 包含 若干 列表 项 ( <1i >… </li>) 
的 列表 ( < 由 > … <vul > ) 和 一 个 段落 ( <p > ) 。 注 意 , 我 们 省 略 了 很 多 无 关 的 代码 。 这 类 语言 
关键 点 是 , 你 可 以 在 普通 文本 中 表示 版 面 的 概念 , 但 代码 与 屏幕 上 的 显示 内 容 之 间 不 是 直接 关联 
的 , 而 是 由 解释 这 些 “ 标 注 ” 命 令 的 程序 来 控制 屏幕 上 的 显示 内 容 。 这 种 技术 极为 简单 ,又 极为 有 
效 (现在 你 所 阅读 的 所 有 文档 、 网 页 等 基本 都 是 这 样 生成 的 ), 但 也 有 其 缺点 。 

本 章 和 之 后 4 章 介绍 另外 一 种 技术 : 一 种 图 形 及 图 形 用 户 界面 直接 对 应 屏幕 显示 的 思想 。 其 
基本 概念 先天 就 都 是 图 形 化 的 (而 且 都 是 二 维 的 , 适应 计算 机 屏幕 的 矩形 区 域 ) ,这些 基本 概念 包 
括 坐 标 、 线 、 和 矩形 和 圆 等 。 从 编程 的 角度 看 , 其 目的 是 建立 内 存 中 的 对 象 和 屏幕 图 像 的 直接 对 应 
关系 。 

其 基本 模型 如 下 ; 我 们 利用 图 形 系统 提供 的 基本 对 象 ( 如 线 ) 组 合 出 更 复杂 的 对 象 ; 然后 将 这 
些 对 象 添加 到 一 个 表示 物理 屏幕 的 窗口 对 象 中 ; 最 后 , 用 一 个 程序 将 我 们 添加 到 窗口 上 的 对 象 显 
示 在 屏幕 上 , 我 们 可 以 将 这 个 程序 看 做 屏幕 显示 本 身 , 或 者 是 一 个 “显示 引擎 ”, 或 者 是 “我 们 的 
图 形 库 ”, 或 者 是 “GUI 库 ”, 甚至 ( 央 默 地 ) 将 其 看 做 “在 屏幕 背后 进行 画图 工作 的 小 矮人 ”, 然 后 





“显示 引擎 负责 在 屏幕 上 绘制 线 , 将 文本 串 放 置 在 屏幕 上 , 为 屏 蒂 区 域 着 色 , 等 等 。 简 单 起 见 ， 
我 们 将 使 用 “我 们 的 GUI 库 "甚至 “系统 "来 表示 显示 引擎 ,虽然 它 的 功能 不 只 是 绘制 对 象 。 与 我 
们 的 代码 调用 GUI 库 实现 大 部 分 图 形 功 能 一 样 ， GUI 库 将 它 的 很 多 工作 交 由 操作 系统 来 完成 。 


12.3 第 一 个 例子 


我 们 的 目标 是 定义 一 些 类 ,能 够 用 来 创建 可 以 在 屏幕 上 显示 的 对 象 。 例 如 , 我 们 希望 绘制 一 
个 由 一 系列 相连 的 线 构成 的 图 形 , 下 面 程序 给 出 了 一 个 非常 简单 的 版 本 : 
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坟 nclude "Simple window.h"” /get access to our window library 
#include "Graph.h" // get access to our graphics library facilities 


int main() 

, using namespace Graph_lib; // our graphics facilities are in Graph_iib 
Point tl(100,100); /to become top left corner of window 
Simple. window win(t1,600,400,"Canvas"); //make a simple window 
Polygon poly; : h make a shape (a polygon) 
poly.add(Point(300,200)); // add a point 
poly.add(Point(350,100)); /add another point 
poly.add(Point(400,200)); /add a third point 
poly.set_color(Color::red);  //adjust properties of poly 


win.attach (poly); / connect poly to the window 


win.wait_for_button(); /give control to the display engine 


} 





区 pe 和 a be 


我 们 来 逐 行 分 析 这 个 程序 , 看 看 它 做 了 什么 。 它 首先 包含 图 形 接 口 库 的 头 文件 : 


#include "Simple window.h”  //getaccess to our window library 
#include "Graph.h" // get access to our graphics library facilities 


接着 ,在 main( ) 函数 的 开始 处 告知 编译 器 在 Graph_lib 中 查找 图 形 工具 : 


using namespace Graph_lib;  //our graphics facilities are in Graph_jib 


然后 , 定义 一 个 点 作为 窗口 的 左上 角 : 


Point t1(100,100); /to become top left corner of window 
接 下 来 在 屏幕 上 创建 一 个 窗口 : 

Simple_window win(tl600,400,"Canvas"); /make a simple window 
我 们 使 用 Graph_lib 接口 库 中 一 个 名 为 Simple_window 的 类 表示 窗口， 此 处 定义 了 一 个 名 为 win 的 
Smple_window 对 象 , 并 使 用 初始 化 列表 中 的 值 将 窗口 的 左上 和 角 设 置 为 ti, 宽度 和 高 度 分 别 设置 为 
600 和 400 像素 。 我 们 随后 会 介绍 更 多 细节 , 但 此 处 的 关键 点 就 是 通过 给 定 宽度 和 高 度 来 定义 一 
个 矩形 。 字 符 串 Canvas 用 于 标识 该 窗口 ,你 可 以 在 窗口 框 左上 角 的 位 置 看 到 Canvas 字样 。 

接 下 来 , 我 们 在 窗口 中 放置 一 个 对 象 : 
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Polygon poly; // make a shape (a polygon) 


poly.add(Point(300,200)); // add a point 
poly.add(Point(350,100)); // add another point 
poly.add(Point(400,200)); /add a third point 


我 们 定义 了 一 个 多 边 形 对 象 poly, 并 向 其 添加 顶点 。 在 我 们 的 图 形 库 中 , 一 个 Polygon 对 象 开始 为 
空 , 可 以 向 其 中 添加 任意 多 个 顶点 。 由 于 我 们 添加 了 三 个 顶点 , 因此 得 到 了 一 个 三 角形 。 一 个 点 
是 一 个 值 对 , 给 出 了 点 在 窗口 内 的 x 和 了 (水 平和 垂直 ) 坐 标 。 

纯粹 是 为 了 展示 图 形 库 的 功能 , 我 们 接 下 来 将 多 边 形 的 边 沼 为 红色 : 


poly.set_color(Color::red); /adjust properties of poly 
最 后 ,我 们 将 poly 添加 到 窗口 win: 

win.attach(poly); // connect poly to the window 
如 果 程 序 执行 得 不 是 那么 快 , 你 会 注意 到 , 到 现在 为 止 , 屏幕 上 没有 任何 显示 , 是 的 , 什么 都 没 
有 。 我 们 创建 了 一 个 窗口 (Simple_window 类 的 一 个 对 象 ), 创建 了 一 个 多 边 形 ( 名 为 poly) 并 将 其 
染 为 红色 ( Color :: red), 最 后 将 其 添加 到 窗口 win, 但 我 们 还 没有 要 求 在 屏幕 上 显示 此 窗口 。 显 示 
操作 由 程序 的 最 后 一 行 代码 来 完成 : 


win.wait_for_button(); /give control to the display engine 
为 了 让 GUI 系统 在 屏幕 上 显示 一 个 对 象 , 你 必须 将 控制 权 交 给 “ A o。 wait_for on ) 各 证 光 
成 这 个 功能 , 另外 , 它 还 等 竺 用户 按 下 (点 击 ) 窗 口中 的 总 

“Next” 按钮， 以 便 执行 下 面 的 程序 。 这 样 , 在 程序 结束 和 窗 
口 消失 之 前 ， 你 就 有 机 会 看 到 窗口 中 的 内 容 。 当 你 按 下 
“Next "按钮 后 , 程序 会 结束 , 将 关闭 窗口 。 

单独 地 看 这 个 窗口 ,效果 如 右 图 所 示 。 标 记 为 “Next” 的 
按钮 是 从 哪里 来 的 ?实际 上 它 是 Simple_window 类 内 置 的 。 在 . 
第 16 章 中 , 我 们 将 会 从 Simple_window 类 过 渡 到 “普通 ”的 Win- 
dow 类 , 它 不 包含 任何 可 能 造成 混淆 的 内 置 功能 。 人 我 们 还 会 介绍 如 何 编写 代码 来 控制 与 窗口 
的 交互 。 

在 接 下 来 的 三 章 里 ， 当 希望 逐 阶 段 ( 一 帧 一 帧 ) 地 显示 信息 时 , 我 们 将 简单 地 使 用 "Next "按钮 
来 实现 显示 画面 的 转换 。 - 

对 于 操作 系统 为 每 个 窗口 添加 窗口 框 (frame), 你 应 该 非常 熟悉 了 , 但 可 能 没有 特别 留意 过 。 
不 过 , 本 章 和 后 面 章 节 中 的 图 片 都 是 在 微软 Windows 系统 下 生成 的 , 因此 你 “免费 "得 到 了 窗口 框 
右上 角 的 三 个 常用 按钮 。 这 些 按钮 是 很 有 用 的 : 如 果 你 的 程序 变 得 杂乱 无 章 (在 调试 过 程 中 确实 
有 可 能 出 现 这 种 情况 ), 可 以 点 击 x 按钮 结束 程序 。 当 你 在 其 他 系统 上 运行 程序 时 , 根据 系统 惯 
例 的 不 同 , 添加 的 窗口 框 也 可 能 有 所 不 同 。 在 上 面 的 示例 程序 中 , 我 们 对 窗口 框 所 做 的 仅仅 是 设 
置 了 一 个 标签 “Canvas”。 


12.4 ”使 用 GUI 库 


在 本 书 中 , 我 们 不 直接 采用 操作 系统 的 图 形 和 GUI 工具 , 否则 会 将 程序 限制 在 一 种 特定 的 操 
作 系 统 上 , 而且 需要 处 理 很 多 复杂 的 细节 问题 。 与 处 理 文本 VO 一样 , 我 们 将 使 用 一 个 晴 数 库 来 
消除 操作 系统 间 的 差异 、LO 设备 的 变化 等 问题 , 并 简化 程序 代码 。 不 幸 的 是 , C++ 并 没有 提供 
一 个 像 标 准 流 VO 库 一 样 的 标准 GUI 库 , 于 是 我 们 从 很 多 可 用 的 GUI 库 选 择 了 一 个 。 为 了 不 局 限 
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于 这 种 GUI 库 , 并 且 避 免 一 开始 就 接触 其 复杂 功能 , 我 们 只 使 用 一 组 在 任何 BUTIE 库 中 都 只 需 几 和 百 
行程 序 就 能 实现 的 接口 类 。 

我 们 使 用 的 (目前 还 只 是 间接 使 用 ) GUI 工具 包 名 为 FLIK (Fast Light Tool Kit. 读 做 “full 
tick”) , 具体 请 参考 www. fltk. org。 因 此 , 我 们 的 代码 可 以 移植 到 任何 使 用 FLTK 的 平台 一 一 包括 
Windows、UNIX、Mac、Linux 等 。 而 且 我 们 的 接口 类 也 可 以 使 用 其 他 的 图 形 工 具 包 重新 实现 , 因此 
基于 它 的 代码 的 移植 性 实际 上 还 要 更 好 一 些 。 

接口 类 实现 的 编程 模型 比 通常 的 工具 包 提 供 的 更 简单 。 例 如 , 我 们 整个 图 形 和 GUI 接口 库 的 C++ 
代码 大 约 为 600 行 , 而 最 简单 的 FLTK 文档 也 达 370 
页 。 你 可 以 从 www. fltk. org 下 载 , 但 我 们 并 不 推荐 你 
阅读 , 目前 还 不 需要 那些 细节 。 第 12 ~ 16 章 给 出 的 
概念 可 用 于 任何 一 个 流行 的 GUI 工具 包 ， 当然 我 们 
也 会 解释 接口 类 是 如 何 映射 到 FLIK 的 , 以 便 在 必要 
的 时 候 能 够 直接 使 用 其 他 的 工具 包 。 

我 们 实现 的 图 形 工 具 包 的 部 分 结构 如 右 图 所 
示 。 接 口 类 为 二 维 形状 提供 了 简单 、 用 户 可 扩展 
的 基本 框架 , 并 支持 简单 的 颜色 。 为 了 实现 这 些 
功能 , 我 们 给 出 了 基于 “回调 函数 ”的 GUI 概念 , 这 些 函 数 由 屏幕 上 的 用 户 自 定 义 按钮 等 组 件 触发 
(参见 第 16 章 )。 


12.5 坐标 系 


计算 机 屏幕 是 一 个 由 像素 组 成 的 矩形 区 域 , 像素 是 一 个 可 以 设置 为 某 种 颜色 的 点 。 在 程序 
中 , 最 常见 的 方式 就 是 将 屏幕 建 模 为 由 像素 组 成 的 矩形 区 域 , 每 个 像素 由 x( 水 平 ) 坐 标 和 了 ( 垂 
直 ) 坐标 确定 。 最 左 端的 像素 的 x 坐标 为 0, 向 右 逐 步 递增 , 直 oo0 






The operating system 
(eg Windows or Linux) | 





200.0—— 
到 最 右 端的 像素 为 止 ; 最 顶端 的 像素 的 y 坐标 为 0, 向 下 逐步 
递增 , 直到 最 底 端 的 像素 为 止 。 注 意 , y 坐标 是 “向 下 增长 "的 。 3 
这 可 能 有 点 奇怪 , 特别 是 对 数学 家 而 言 。 但 是 , 屏幕 (窗口 ) 大 10o es 


小 各 异 , 左上 角 可 能 是 不 同 屏幕 的 唯一 共同 之 处 了 , 因此 将 其 | 
设 定 为 原点 。 

不 同 屏幕 的 像素 数 可 能 各 不 相同 , 常见 的 尺寸 有 : 1024 x 768、1280 x 1024 、1450 x 1050 和 
1600 x1200 。 

在 使 用 屏幕 与 计算 机 进行 交互 时 , 通常 从 屏幕 上 划分 出 特定 用 途 的 、 由 程序 控制 的 矩形 区 


域 一 一 窗口 。 对 窗口 的 操作 与 屏幕 完全 一 致 。 基 本 上 , 我 们 将 窗口 看 做 一 个 小 屏幕 。 例 如 : 
Simple_window win(tl,600,400,"Canvas"); 


该 语句 定义 了 宽度 为 600 个 像素 、 高 度 为 400 个 像素 的 和 矩 形 区 域 , x 坐标 从 左 到 石 为 0~599, y 坐 
标 从 上 到 下 为 0 ~399。 能 够 进行 绘制 的 窗口 区 域 通常 称 为 画布 (canvas)。 我 们 指定 的 大 小 600 x 
400 指 的 就 是 ”内 部 大 小 ”， 即位 于 系统 提供 的 窗口 框 内 部 的 大 小 , 不 包括 标题 栏 、 退 出 按钮 等 占 
用 的 空间 。 


12.6 形状 
我 们 提供 的 基本 绘图 工具 包 由 12 个 类 构成 : 
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i es 即 eh 是 一 种 Ss 
我 们 将 从 以 下 类 开始 进行 介绍 : 


® Simple_window、 Window 


® Shape、 Text、 Polygon、Line、Lines、Rectangle、Function 等 
® Color、 Line_style、Point 
® Axis 
第 16 章 将 引入 GUI( 用 户 交 互 ) 类 : 
e Button、In_box、Menu 等 
我 们 可 以 很 容易 地 添加 更 多 的 类 ( 当然 取决 于 你 对 “容易 ”的 定义 ) , 例如 : 
® Spline、Grid、Block_chart、Pie_chaxrt 等 
然而 , 定义 或 描述 一 个 完整 的 GUI 框架 及 其 所 有 功能 已 经 超出 了 本 书 的 范围 。 


12.7 使 用 形状 类 


本 节 介 绍 图 形 库 的 一 些 基 本 特性 : Simple_window、Window、Shape、Text、 Polygon、Line、Lines、 
Rectangle、Color、Line_style 、Point 、Axis， 目 的 是 让 你 知道 这 些 特性 能 够 实现 什么 功能 ,而 并 非 详 
细 理 解 某 个 类 。 第 13 章 将 会 介绍 每 个 类 的 设计 与 实现 。 

下 面 我 们 来 学 习 一 个 简单 的 程序 , 我 们 将 逐 行 解释 代码 , 并 说 明 每 一 行 代码 在 屏幕 上 的 显示 
效果 。 在 程序 运行 时 ， 你 会 看 到 当 我 们 向 窗口 添加 形状 以 及 改变 已 有 形状 时 ， 屏幕 上 图 像 的 变化 
情况 。 基 本 上 , 我 们 是 通过 分 析 程 序 的 执行 情况 来 “动画 演示 ”代码 的 流程 。 

12.7.1 图 形 头 文件 和 主 函 数 
首先 , 包含 定义 了 图 形 和 GUI 功能 接口 的 头 文件 : 


#include "Window.h" /aplain window 
#include "Graph.h" 


或 者 
#include "Simple_ window.h' /if we want that “Next” button 
#include "Graph.h" 


其 中 ， Window. h 包含 与 窗口 有 关 的 特性 ; Graph. h 包含 在 窗口 上 绘制 形状 (包括 文本 ) 的 有 关 特 
性 ， 这 些 特性 都 定义 在 Graph_lib 名 字 空 间 中 。 为 简化 起 见 ， 我 们 使 用 名 字 空 间 指 令 ， 使 得 Graph_ 
ib 中 的 名 字 可 以 直接 在 程序 中 使 用 ， 


using namespace Graph_lib; 


按照 惯例 ,main( ) 渔 数 包含 我 们 要 (直接 或 间接 ) 执 行 的 代码 及 例外 处 理 ; 


int main () 
try 
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//... here is our code .，. 


. Catch(exception& e) { 
/ some error reporting 
return 1; 
} 
catch(...) { 
/ some more error reporting 
return 2; 


} 
为 了 使 此 main( ) 编译 通过 ,我 需要 定义 exception。 如 果 像 往常 一 样 包含 了 头 文件 std lib facili- 
ties. h 或 者 直接 包含 标准 头 文件 < stdexcept > ,就 会 获得 exception 的 定义 。 
12. 7.2 一 个 几乎 空白 的 窗口 
在 这 里 , 我 们 不 讨论 错误 处 理 ( 参 见 第 5 章 , 特别 是 5. 6. 3 节 ), 直接 进入 main( ) 函数 中 的 图 
形 代码 ，; 


Point tI(100,100); // top left corner of our window 


Simpie_ window win(tl,600,400,"Canvas"); 
/ screen coordinate ti for top left corner 
/ window size(600*400) 
/ title: Canvas 

win.wait_for_button(); // display! 


这 有 段 代码 首先 创建 一 个 Simple_window， 即 一 个 有 "Next "按钮 的 窗口 ， 并 将 它 显 示 在 屏幕 上 。 显 
然 , 我 们 应 该 包含 头 文件 Simple_window. h 而 不 是 Window. h。 在 这 里 ,我们 明确 给 出 了 窗口 在 屏 
幕 上 的 显示 位 置 : 其 左上 角 位 于 Point(100, 100) 。 这 个 位 置 很 接近 屏幕 的 左上 角 , 但 没有 过 于 靠 
近 。 很 显然 ,Point 是 一 个 类 , 其 构造 函数 有 两 个 整 型 参数 , 表示 点 在 屏 蒂 上 的 (x, y) 坐标 。 我 们 
可 以 将 代码 写 为 : 

Simple_window win(Point(100,100),600,400,"Canvas"); 
然而 , 为 了 便于 多 次 使 用 点 (100, 100) , 我 们 还 是 选择 给 它 一 个 符号 名 称 。600 和 400 分 别 是 窗口 
的 宽度 和 高 度 ，Canvas 是 在 窗口 框 上 显示 的 标签 。 

为 了 真正 将 窗口 绘制 在 屏幕 上 , 我 们 必须 将 控制 权 交 给 GUI 系统 。 我 们 通过 调用 win. wait_ 
for_button ( J 结果 如 下 图 所 示 : 





在 窗口 的 背景 中 ， 我 们 着 到 了 一 个 笔记 本 电 脑 的 旧 面 (已 经 性 时 清理 过 本 )。 如 果 你 对 桌面 背景 这 
种 不 相关 的 事情 感到 好 奇 , 我 可 以 告诉 你 , 我 拍摄 照片 时 正 站 在 安 提 布 的 毕加索 图 书馆 附近 俯 歼 
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尼斯 湾 。 隐 藏 在 程序 窗口 之 后 的 黑色 控制 台 窗 口 是 用 来 运行 我 们 的 程序 的 。 使 用 控制 台 窗 口 不 
太美 观 , 而 且 也 不 是 必须 的 , 但 A a a lela hil 我 
们 可 以 通过 它 来 终止 程序 。 如 果 你 仔细 观察 , 会 发 现 我 们 使 人 
用 的 是 微软 C++ 编译 器 ,当然 你 可 以 使 用 其 他 编译 器 (如 
Borland 或 者 GNU ) 。 

在 后 面 的 介绍 中 , 我 们 将 去 掉 程序 窗口 周围 分 散 注 意 力 
的 内 容 , 仅仅 给 出 窗口 本 和 喘 如 右 图 所 示 。 窗 口 的 实际 尺寸 (以 
像素 计算 ) 依赖 于 屏幕 的 分 辨 率 。 某 些 屏幕 的 像素 要 比 其 他 屏 
幕 更 大 。 
12.7.3 坐标 轴 

一 个 几乎 空 Sli 口 没 有 什么 意思 , 最 好 给 它 添加 一 些 信息 。 希 望 添加 一 些 什么 内 容 呢 ?” 注 

性 的 、 有 
点 复杂 的 图 形 开始 。 ep 我 们 通常 难以 和 弄 清 数据 的 含义 。 或 许 你 可 以 借助 伴随 的 
文字 , 但 使 用 坐标 轴 要 保险 得 多 一 一 人 们 通常 不 会 阅读 文字 描述 , 而 且 好 的 图 形 表 示 通 常会 与 最 
初 的 上 下 文 分 离 。 因 此 , 图 形 需 要 坐标 轴 : 


Axis xa(Axis: :x, Point(20,300), 280, 10, "x axis"); // make an Axis 
/an Axis is a kind of Shape 
1 Axis::x means horizontal 
/ starting at (20,300) 
// 280 pixels long 
AH 10 “notches” 
// label the axis “x axis” 








win.attach(xa); // attach xa to the window, win 
win.set_label("Canvas #2"); / relabel the window 
win.wait_for_button(); 1 display! 


具体 操作 步骤 为 : 创建 坐标 轴 对 象 , 将 其 添加 到 窗口 , 最 后 进 
行 显 示 , 如 右 图 所 示 。 可 以 看 到 ，Axis :: x 是 一 条 水 平 线 , 其 
上 有 指定 数量 (10 个 ) 的 刻度 和 一 个 标签 “x axis”"。 通 常 ， 标 
签 用 于 解释 坐标 轴 和 刻度 的 含义 。 我 们 通常 把 x 轴 放 在 窗口 
底 端 附近 。 在 实际 应 用 中 , 我 们 更 喜欢 用 符号 常量 来 表示 高 
度 和 宽度 这样“ 在 底 端 上 方 附近 ”就 可 以 用 y_max-bottom_ 
margin 这 样 的 符号 表示 ， 而 不 是 用 300 这 样 的 * 麻 数 ”( 人 参见 
4.3.1 节 和 15.6.2 节 )。 

为 了 帮助 识别 程序 的 输出 , 我 们 用 Window 的 成 员 函 数 set_label( ) 将 该 窗口 重新 标记 为 
“Canvas #2”。 


现在 , 添加 一 个 y 坐标 轴 : 
Axis ya(Axis: ;y, Point(20,300), 280, 10, "y axis"); 








ya.set_color(Color: :cyan); /l/choose a color . 六 
ya.label.set_color(Color::dark red);  //choose a color for the text 
win.attach (ya); ; 


win.set_label("Canvas #3"); 
win.wait for button0; / display! 


我 们 将 y 轴 和 标签 的 颜色 分 别 设置 为 cyan 和 dark red。 我 们 认为 x 轴 和 y 轴 使 用 不 同 颜色 并 不 是 
一 个 好 主意 , 这 里 只 是 为 了 说 明 如 何 设 置 形 状 或 者 其 中 某 个 元 素 的 颜色 。 使 用 很 多 种 颜色 未 必 是 
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个 好 主意 , 特别 是 初学 者 更 容易 热衷 于 使 用 很 多 颜色 。 





12.7.4 绘制 函数 图 
接 下 来 做 什么 ? 现在 , 我 们 已 经 有 了 一 个 包含 坐标 轴 的 窗口 ， 因 此 看 起 来 画 出 一 个 函数 是 个 
好 主意 。 我 们 创建 一 个 形状 来 表示 正弦 函数 , 并 将 它 添加 到 窗口 : 


Function sine(sin,0,100,Point(20,150),1000,50,50); /sine curve 
// plot sin() in the range {0:100) with (0,0) at (20,150) 
/ using 1000 points; Scale x values *50, scale y values *50 


win.attach(sine); 
win.set_label("Canvas #4"); 
win.wait_for_button(); 


在 这 段 代码 中 , 名 为 sine 的 Function 对 象 使 用 标准 库 函 数 
sin( ) 产 生 的 值 绘制 一 条 正弦 曲线 。 我 们 将 在 15.3 节 详 细 
讨论 如 何 绘制 函数 图 。 现 在 , 你 只 需要 知道 绘制 函数 图 时 

必须 给 出 起 始点 的 位 置 和 输入 值 集合 ( 值 域 ), 并 且 还 需要 
给 出 一 些 信息 来 说 明 如 何 将 这 些 内 容 塞 人 窗口 (缩放 ) ， 如 
右 图 所 示 。 请 注意 在 到 达 窗 口 右边 界 时 曲线 是 如 何 停止 
的 。 当 我 们 绘制 的 点 超出 窗口 矩形 区 域 时 , 将 被 CUI 系统 简单 忽略 掉 , 永远 不 会 真正 显示 出 来 。 
12. 7.5 Polygon 

函数 图 是 表示 数据 的 一 种 方法 , 在 第 15 章 将 会 看 到 更 多 实例 。 我 们 还 可 以 在 窗口 中 绘制 不 

同类 型 的 对 象 : 几何 形状 。 我 们 使 用 几何 形状 来 进行 图 形 演 示 , 可 以 指示 用 户 交 互 组 件 ( 如 按 
钮 ) , 通常 还 能 使 演示 更 加 生动 。Polygon( 多 边 形 ) 描述 为 一 个 点 的 序列 , 这 些 点 通过 线 连 接 起 来 
就 构成 Polygon 类 。 第 一 条 线 连接 第 一 个 点 到 第 二 个 点 , 第 二 条 线 连 接 第 二 个 点 到 第 三 个 点 …… 
最 后 一 条 线 连接 最 后 一 个 点 到 第 一 个 点 : 


sine.set_color(Color::blue); /we changed our mind about sine’s color 





Polygon poly; //a polygon; a Polygon is a kind of Shape 
poly.add(Point(300,200)); // three points make a triangle 
poly.add(Point(350,100)); 

poly.add(Point(400,200)); 


poly.set_color(Color: :red); 
poly.set_style(Line_style: :dash); 
win.attach(poly); 
win.set_label("Canvas #5"); 
win.wait_for_button(); 


这 段 代码 首 先 展示 了 如 何 改 变 正弦 曲线 的 颜色 。 然 后 , 与 12. 3 节 的 例子 一 样 , 我 们 添加 了 一 个 三 
角形 ,作为 一 个 多 边 形 的 例子 。 然 后 我 们 再 次 设置 了 颜色 ， 最 后 设置 了 线 型 。Polygon 的 线 都 有 


258 锚 二 部 分 痊 入 和 粉 出 





“ 线 型 ”, 默认 线 型 为 实 线 , 但 我 们 也 可 根据 需要 改 为 虚线 、 点 状 线 等 , 如 下 图 所 示 : 
12.7.6 Rectangle 


屏幕 是 矩形 , 窗口 是 矩形 , 一 张 纸 也 是 一 个 撼 
形 。 实 际 上 , 现实 世界 中 有 很 多 形状 都 是 矩形 (或 者 
至 少 是 贺 角 和 矩 形 ), 原因 在 于 和 矩形 是 最 容易 处 理 的 形 
状 。 例 如 , 和 矩 形 的 易于 找 述 (左上 角 和 宽度 和 高 度 ， 
或 者 左上 角 和 右 下 角 , 诸如 此 类 )、 易 于 判断 一 个 点 
在 和 矩形 之 内 还 是 之 外 、 易 于 用 硬件 快速 绘制 由 像素 
构成 的 矩形 。 

与 其 他 封闭 的 形状 相 比 , 大 多 数 高 层 图 形 库 能 够 更 好 地 处 理 和 矩形 。 因 此 , 我 们 将 矩形 类 Rec- 


tangle 从 多 边 形 类 Polygon 中 独立 出 来 。 一 个 Rectangle 可 以 用 左上 和 角 坐 标 、 宽 度 和 高 度 来 描述 : 


Rectangle r(Point(200,200), 100, 50); /top left corner width, height 

win.attach(r); 
win.set_label("Canvas #6"); ; - 
win.wait for_button(); 


可 得 到 下 图 : . | 








请 注意 , 将 位 置 正确 的 4 个 点 连接 起 来 并 不 一 定 得 到 一 个 Rectangle。 当 然 , 创建 一 个 看 起 来 像 
Rectangle 的 Closed_polyline 是 很 简单 的 (你 甚至 可 以 创建 一 个 看 起 来 像 是 Rectangle 的 Open_poly- 
line) , 例如 : z 


Closed_polyline poly_rect; 
ee poly_rect.add(Point(100,50)); 
poly_rect.add(Point(200,50)); 
poly_rect.add(Point(200,100)); 
poly_rect.add(Point(100,100)); 





Rectangle 对 象 , 而 且 它 也 不 知道 有 关 “ 和 矩形 ”的 任何 内 容 。 验 

证 这 一 点 的 最 简单 的 方法 是 再 添加 一 个 点 : 
poly_rect.add(Point(50,75)); 

和 矩形 是 不 会 有 5 个 点 的 , 如 右 图 所 示 。 对 于 我 们 分 析 程 序 

非常 重要 的 一 点 是 : Rectangle 不 仅仅 是 在 屏幕 上 看 起 来 像 . 

是 一 个 矩形 而 已 , 它 还 应 该 从 根本 上 保证 此 形状 (几何 意义 
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上 ) 始 终 是 一 个 矩形 。 这 样 , 我 们 编写 代码 时 就 可 以 信赖 Rectangle 一 一 它 确 实 表 示 王 个 算 形 /而 
且 保 证 不 会 改变 为 其 他 形状 。 
12.757” 纺 充 
前 面 绘制 形状 都 是 绘制 轮廓 , 我 们 也 可 以 使 用 某 种 颜色 “填充 "形状 : 
r.set_fill_color(Color: :yellow); I color the inside of the rectangle 
poly.set_style(Line_style(Line_style: :dash,4)); 
poly_rect.set_style(Line_style(Line_style: :dash,2)); 
poly_rect.set_fill_color (Color:: green)); 


Win.set label("Canvas #7"); 
win.wait for_button(); 


我 们 同时 将 和 矩形 (poly) 的 线 型 改 为 “ 粗 (4 售 粗细 ) 虚线 ”。 
类 似 地 , 我 们 也 改变 了 poly_reet( 现在 已 经 不 是 矩形 了 ) 的 
线 型 ， 如 右 图 所 示 。 如 果 你 仔细 观察 poly_rect, 你 会 发 现 轮 
廊 是 在 填充 色 上 层 显 示 的 。 
任何 封闭 的 形状 都 可 以 填充 (参见 13.9 节 )。 和 珑 形 很 
特殊 , 它 非常 容易 填充 (填充 速度 也 非常 快 ) 。 
12.7.8 文本 
最 后 , 任何 一 个 绘图 系统 都 不 可 能 完全 没有 简单 的 文本 输出 方式 一 一 将 每 个 字符 看 做 线 的 集 
合 来 绘制 ,并 保证 不 会 剪 切 掉 字 符 。 我 们 已 经 展示 了 如 何 为 窗口 和 坐标 轴 设 置 标签 ,我 们 也 使 用 
Text 对 象 将 文本 放置 在 任何 位 置 : 








Text t(Point(150,150), "Hello, graphical world! "); 
win.attach(t); 

Win.set_label("Canvas #8"); 
win.wait_for_button(); 





利用 此 例 中 的 基本 图 形 元 素 , 你 可 以 生成 任何 复杂 、 微妙 的 显示 效果 。 请 注意 本 章 所 有 代码 的 一 
个 共同 特点 : 没有 循环 和 选择 语句 ， 而 且 所 有 数据 都 是 " 硬 编 码 的 。 输 出 内 容 只 是 基本 图 形 元 素 
的 简单 组 合 。 一 旦 我 们 开始 使 用 数据 和 算法 来 组 合 这 些 基 本 图 形 , 就 可 以 得 到 更 复杂 、 更 有 趣 的 
输出 效果 了 。 z 

我 们 已 经 看 到 如 何 改 变 文本 的 颜色 了 : 坐标 轴 的 标签 (参见 12.7.3 节 ) 本 身 就 是 一 个 Text 对 


象 。 此 外 , 我 们 还 可 以 为 文本 选择 字体 和 字号 : 
t,set_font(Font: :times_bold); 
t,.set_font_size(20); 
win.set label("Canvas #9"); 
win,wait_for_button(); 


这 段 代码 将 Text 的 字符 串 “Hello，graphical world1” 中 的 字 
符 放 大 到 20 号 字 , 字体 设置 为 粗 体 Times, 如 右 图 所 示 。 
12.7.9 图 片 


我 们 还 可 以 从 文件 中 加 载 图 片 ; 


Image ii(Point(100,50),"image.jpg");  //400*212-pixel jpg 
win.attach(ii); 
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win.set_label("Canvas #10"); 
win.wait_for_button(); 


执行 上 述 代码 将 在 窗口 中 显示 文件 名 为 image. jpg 的 照片 (两 架 飞 机 正在 突破 音 障 ) : 





这 幅 照片 比较 大 , 我 们 刚好 把 它 放 在 了 文本 和 图 形 上 层 。 因 此 , 为 了 清理 窗口 , 我 们 将 它 稍 
微 移 开 一 点 ; 


ii.move(100,200); 
win.set_label("Canvas #11"); 
win.wait_for_button(); 





注意 , 不 在 窗口 区 域 之 内 的 部 分 图 片 是 如 何 被 简单 忽略 掉 的 。 超 出 窗口 区 域 的 内 容 都 会 这 样 被 图 


12. 7. 10 还 有 很 多 未 讨论 的 内 容 
下 面 代码 展示 了 图 形 库 更 多 的 特性 , 我 们 在 这 里 不 再 进行 详细 解释 : 


Circle c(Point(100,200),50); 
Ellipse e(Point(100,200), 75,25); 
e.set_color(Color: :dark_red); 
Mark m(Point(100,200),'x'); 


ostringstream oss; 
OSS << "SCreen size: " << x_max() << "*" << y._max() 

<<"; window size: " << win.x_max() << "*" << win.y_max(); 
Text sizes(Point(100,20),0ss.str()); 


Image cal(Point(225,225),"snow_cpp.-.gif");  //320*240-pixe! gif 
cal.set_mask(Point(40,40),200,150); /display center part of image 


win.attach(c); 
win.attach(m); 
win.attach(e); 


win.attach(sizes); 
win.attach(cal); 
win.set_label("Canvas #12"); 
win.wait_for_button(); 


你 能 猜 出 这 段 代码 会 显示 什么 内 容 吗 ? 是 不 是 很 容易 猜 ? 
见 右 图 。 代 码 与 屏幕 显示 内 容 的 关联 是 很 直接 的 。 如 果 你 还 
未 看 出 这 段 代 码 是 如 何 产生 这 样 的 输出 的 ,请 继续 学 习 后 序 
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章节 , 很 快 就 会 搞 清 楚 的 。 请 注意 我 们 是 如 何 使 用 stringstream( 人 参见 11.4 节 ) 来 格式 化 显示 尺寸 的 文 


本 对 象 的 。 
12.8 让 图 形 程 序 运行 起 来 


我 们 已 经 看 到 了 如 何 创 建 窗口 以 及 如 何在 窗口 中 绘制 各 种 各 样 的 形状 。 在 后 续 章 节 中 , 我 


们 将 会 看 到 这 些 Shape 类 是 如 何 定义 的 以 及 它们 更 多 的 使 用 方法 。 


为 了 使 这 个 图 形 程序 运行 起 来 , 还 需要 其 他 程序 的 帮助 。 除 了 主 函 数 中 已 有 的 代码 外 , 我 们 
需要 编译 接口 库 代 码 、 安 装 FLTK 库 ( 或 者 所 使 用 的 任何 GUI 系统 )， 并 将 它 与 我 们 的 代码 正确 


0 这 样 才能 让 这 个 图 形 程序 运行 起 来 。 
我 们 可 以 将 这 个 程序 看 做 由 4 个 不 同 的 部 分 构成 : 
。 我 们 编写 的 代码 (main( ) 函数 等 ) 
e 接口 库 ( Window、Shape、Polygon 等 ) 
e FLTK 库 
。 C++ 标准 库 


另外 , 程序 还 间接 用 到 了 操作 系统 。 忽 略 了 操作 系统 和 标准 库 之 后 , 我 们 的 图 形 代码 的 组 织 结 


可 描述 如 下 : 








Point.h: 


chapter12.cpp: 


附录 D 说 明了 如 何 让 所 有 这 些 组 成 部 分 一 起 运转 起 来 。 
12. 8.1 源 文件 
我 们 的 图 形 和 GUI 接口 库 由 5 个 头 文件 和 3 个 代码 文件 组 成 : 
。 头 文件 
s Point. h 
= Window. h 
s Simple_window. h 
sm (raph. 上 
u GUI. h 


构 
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。 代码 文件 
m Window. cpp 
u Graph. cpp 
® GUI cpp 
在 学 习 第 16 章 之 前 , 你 可 以 忽略 GUI 源 文件 。 


<》 简单 练习 


”本 练习 是 一 个 与 Hello， World” 程序 相 同 功 能 的 图 形 程序 ， 目 的 是 让 你 熟悉 最 简单 的 图 形 工具 。 
1. 创建 一 个 空 窗 口 Simple_ window ， 尺寸 为 600 x400， 标签 为 My window, 编译 这 个 程序 , 然后 编译 、 链接 并 
运行 。 注 意 , 必须 以 附录 D 描述 的 方法 链接 FLTK 库 ; 在 代码 中 包含 头 文件 #include Graph. h、Window. h 
和 GUL h; 并 将 Graph. cpp 和 Window. cpp 加 入 你 的 项 目 中 。 
2 逐个 添加 12.7 节 中 的 例子 , 每 添加 一 个 就 测试 一 下 。 
3， 检查 并 简单 修改 每 个 例子 (例如 颜色 、 位 置 、 点 的 数量 等 ) 。 
人 思考 是 
. 为 什么 要 使 用 图 形 ? 
.什么 时 候 尽 量 不 使 用 图 形 ? 
. 为 什么 图 形 对 程序 员 来 说 是 有 趣 的 ? 
什么 是 窗口 ? 
图 形 接口 类 (图形 库 ) 在 哪个 名 字 空间 中 ? 
使 用 图 形 库 实现 基本 的 图 形 功 能 需要 哪些 头 文件 ? 
. 最 简单 的 窗口 由 哪 几 部 分 组 成 ? 
. 什么 是 最 小 化 窗口 ? 
. 什么 是 窗口 标签 ? 
10. 如 何 设置 窗口 标签 ? 
11. 屏幕 坐标 系 是 如 何 工作 的 ? 窗口 坐标 系 呢 ? 人 呢 ? 
12. 你 能 显示 的 简单 “形状 ”有 哪些 ? 
13. 将 形状 添加 到 窗口 的 命令 是 什么 ? 
14. 你 使 用 哪 种 基本 形状 来 绘制 六 边 形 ? 
15， 如 何在 窗口 中 的 某 个 位 置 显示 文本 ? 
16. 如 何 将 你 最 好 的 朋友 的 照片 显示 在 窗口 中 (使 用 你 自 已 编写 的 程序 )? ? 
17. 你 创建 了 一 个 Window 对 象 , 但 屏幕 上 没有 显示 任何 内 容 ,可 能 的 原因 有 哪些 ? 
8. 你 创建 了 一 个 形状 , 但 窗口 中 没有 显示 任何 内 容 ， 可 能 的 原因 有 哪些 ? 


O00 wm 上 wb 一 


> 术语 | 
颜色 图 形 JPEG 坐标 GUI ， 线 型 
显示 GUI 库 软件 层 填充 颜色 HTML 窗口 
FLTK 图 像 XML 





了 习题 
我 们 建议 使 用 Simple_window 完成 下 面 的 练习 。 
. 分别 用 Rectangle 和 Polygon 绘制 矩形 , 并 将 Polygon 的 边 设置 为 红色 ，Rectangle 的 边 设置 为 著 色 。 
.绘制 一 个 100 x30 的 Rectangle, 并 在 其 内 显示 文本 “Howdy!”。 
. 绘制 你 名 字 的 每 个 词 的 首 字母 , 高 度 为 150 个 像素 , 使 用 粗 线 , 每 个 字母 使 用 不 同 的 颜色 。 
. 绘制 一 个 8 x8 的 红 白 交替 的 国际 象棋 棋盘 。 
.在 和 矩形 周围 绘制 一 个 1/4 英寸 宽 的 红色 框 , 矩形 的 高 度 为 屏幕 高 度 的 3/4, 宽度 为 屏幕 宽度 的 2/3。 


nn 一 
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6.， 当 绘制 的 Shape 不 能 完全 放 在 窗口 内 时 会 发 生 什么 现象 ? 当 绘制 的 窗口 不 能 完全 置 于 屏 医 内 时 又 会 发 生 
什么 现象 ? 编写 两 个 程序 说 明 这 两 种 现象 。 

7. 绘制 一 个 二 维 的 房屋 正视 图 , 包括 一 扇 门 、 两 扇 窗户 、 带 烟 向 的 屋顶 ， 可 以 随意 添加 其 他 的 细节 ,比如 从 
烟 向 “ 冒 烟 ”等 。 

8. 绘制 奥林匹克 五 环 旗 。 如 果 你 记 不 得 颜色 了 , 请 查找 相关 资料 。 

9. 在 屏幕 上 显示 一 个 图 像 , 例如 一 个 朋友 的 照片 , 并 使 用 窗口 标题 和 窗口 内 的 描述 文字 进行 说 明 。 

10. 绘制 12.8 节 中 的 文件 结构 图 。 

11. 由 内 向 外 绘制 一 系列 正 多 边 形 , 最 里 面 的 是 一 个 等 边 三 角形 , 外 边 是 一 个 正方 形 , 再 外 边 是 一 个 正 五 边 
形 , 依 此 类 推 。 数 学 专业 的 人 士 请 注意 : 让 N 边 形 的 所 有 顶点 都 落 在 (N+1) 边 形 的 边 上 。 

12. 超 椭圆 (superellipse) 是 一 个 由 下 面 的 方程 定义 的 二 维 形状 


ls m,n>0 











请 在 互联 网 上 查找 超 椭圆 ， eR 性 的 认识 。 编 写 程序 , 通过 连接 超 椭圆 上 的 点 构成 
“ 昨 状 ”模式 。 程 序 接受 参数 a、b、m、n 和 N, 在 超 椭圆 上 (由 a、b、m 和 n 定义 ) 选 择 N 个 等 间隔 ( 按 某 
种 “等 间隔 ”的 定义 ) 的 点 , 然后 将 每 个 点 连接 到 其 他 一 个 或 多 个 点 (可 以 用 一 个 参数 k 指出 每 个 点 连接 
的 点 数 , 或 者 直接 使 用 N -1， 即 连接 其 他 所 有 点 )。 

13. 设计 一 种 为 习题 12 中 的 超 椭圆 形 状 添加 颜色 的 方法 。 可 以 为 基 些 线 指定 一 种 颜色 ， 其 他 线 使 用 另 一 = 
或 另 几 种 颜色 。 


一》 附 言 

理想 的 程序 设计 是 将 概念 直接 表示 为 程序 中 的 实体 。 因 此 , 我 们 通常 使 用 类 表示 思想 , 使 用 类 对 象 表 
示 现实 世界 的 实体 , 使 用 函数 表示 行为 和 计算 。 这 种 思路 显然 可 以 用 于 图 形 领域 。 当 我 们 有 了 概念 ,例如 
圆 和 多 边 形 , 就 可 以 在 程序 中 用 Cirele 类 和 Polygon 类 来 表示 。 图 形 应 用 的 不 同 寻 常 之 处 在 于 ， 当 我 们 编写 
图 形 程序 时 , 还 有 机 会 在 屏幕 上 看 到 那些 类 对 象 。 也 就 是 说 , 程序 状态 可 以 直接 呈现 出 来 , 供 我 们 观察 ,而 
在 大 多 数 应 用 中 是 没 这 么 幸运 的 。 思 想 、 代 码 和 输出 的 直接 对 应 是 图 形 程序 设计 如 此 有 吸引 力 的 重要 原因 。 
不 过 , 请 记 住 , 图 形 只 是 体现 了 在 代码 中 使 用 类 直接 表达 概念 的 思想 而 已 。 这 种 思想 才 是 最 重要 的 , 它 非常 
有 效 、 通 用 : 我 们 想到 的 任何 东西 都 可 以 在 代码 中 用 类 、 类 对 象 或 者 一 组 类 来 描述 。 ， 
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“不 能 改变 你 的 思考 方式 的 语言 是 不 值得 学 习 的 。” 





习 语 


第 12 章 介 绍 了 使 用 一 组 简单 的 接口 类 可 以 做 哪些 图 形 应 用 以 及 如 何 做 。 本 章 将 介绍 单个 接 
口 类 , 如 Point、Color、Polygon 、Open_polyline 等 的 设计 、 使 用 和 实现 。 后 续 章 节 将 介绍 设计 一 组 
相关 的 类 的 方法 及 其 更 多 的 实现 技术 。 


13. 1 图 形 类 概览 


图 形 和 GUI 库 提 供 了 大 量 的 特性 。“ 大量” 的 意思 是 数 百 个 类 , 每 个 类 一 般 都 有 数 十 个 处 理 
函数 。 阅 读 它 的 说 明 书 、 手 册 或 文档 有 点 像 阅读 一 本 老式 的 植物 学 教材 ， 其 中 列 出 了 数 千 种 植物 
的 详细 信息 , 而 这 些 植物 的 分 类 模糊 不 清 。 真 是 令 人 肖 丧 ! 但 也 有 令 人 兴奋 的 一 面 , 浏览 最 新 的 
图 形 /GUI 库 特性 会 使 你 感觉 像 是 一 个 孩子 进入 了 糖果 店 , 但 搞 清楚 应 该 从 哪里 开始 , 哪些 是 真正 
对 你 有 用 的 , 仍旧 十 分 困难 。 : 

我 们 设计 这 个 接口 库 的 目标 之 一 就 是 减 小 成 熟 的 图 形 /GUI 库 的 复杂 性 带 来 的 学 习 难 度 。 我 
们 只 提出 了 24 个 几乎 没有 任何 操作 的 类 , 但 它们 仍 能 够 产生 有 用 的 图 形 输出 。 另 一 个 紧密 相关 
的 目标 是 通过 这 些 类 引入 重要 的 图 形 和 GUI 概念 。 现 在, 你 已 经 能 编写 程序 , 将 结果 显示 为 简单 
的 图 形 了 。 .经 过 本 章 的 学 习 , 你 的 图 形 程序 设计 能 力 将 会 超出 大 多 数 人 最 初 的 期 待 。 经 过 第 14 章 
的 学 习 , 你 将 会 理解 大 多 数 设计 技术 及 其 思想 , 从 而 能 够 加 深 理 解 , 并 能 够 根据 需要 扩展 图 形 表 达 
能 力 。 为 了 实现 扩展 , 你 既 可 以 向 我 们 的 图 形 /GUI 库 中 添加 新 的 特性 , 也 可 以 采用 其 他 C++ 图 
形 /GUI 库 。 


重要 的 接口 类 如 下 表 所 示 : 
图 形 接 口 类 
Color 用 于 设置 线 、 文本 及 形状 填充 的 颜色 
Line_style 用 于 设置 线 型 
Point 表示 屏幕 上 和 Window 内 的 位 置 
Line 对 应 屏幕 上 的 一 个 线段 , 用 两 个 Point 对 象 (端点 ) 来 描述 
- Open_polyline 相连 的 线段 序列 , 用 一 个 Point 对 象 序列 来 描述 
Closed_polyline 与 Open_polyline 类 似 , 唯一 的 差别 是 要 有 一 个 线段 连接 最 后 一 个 Point 和 第 一 个 Point 
Polygon 所 有 线段 均 不 相交 的 Closed_polyline 
Text 字符 串 文 本 
Lines 线段 集合 , 用 Point 对 的 集合 来 描述 
Rectangle 和 矩形, 经 过 优化 , 显示 快速 、 便 捷 
Circle 圆 , 用 圆心 和 半径 定义 
Ellipse 椭圆 , 用 圆心 和 两 个 轴 来 描述 
Function 函数 , 画 出 其 一 段 值 域内 的 图 形 
Aixs 带 标签 的 坐标 轴 


Mark 用 一 个 字符 (如 x 或 0) 标 记 的 点 
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图 形 接 口 类 
Marks 带 标记 (如 x 和 0o) 的 点 的 序列 
Marked_polyline 点 被 标记 的 Open_polyline 
Jmage 图 像 文件 的 内 容 
第 15 章 将 介绍 Function 和 Axis, 第 16 章 介 绍 主要 的 GUI 接口 类 ， 
GUI 接口 类 
Window 屏幕 的 一 个 区 域 , 用 来 显示 图 形 对 象 
Simple_window 带 有 ”Next "按钮 的 窗口 
Button 窗口 中 的 一 个 矩形 , 通常 带 有 标 答 ,可 以 通过 点 击 它 来 执行 对 应 函数 
In_box 窗口 中 的 一 个 框 , 通常 带 标签 ,用 户 可 在 其 中 输 和 人文 本 字符 串 
Out_box 窗口 中 的 一 个 框 , 通常 带 标签 , 用 户 程序 可 在 其 中 输出 字符 串 
Menu Button 同 量 
源 文 件 组 织 如 下 : 
图 形 接口 源 文件 
Point h Point 
Graph. h 所 有 其 他 接口 类 
Window. h Window 
Simple_window. h Simple_window 
GUL h Button 和 其 他 GUUI 类 
Graph. cpp 给 出 Graph. h 中 函数 的 定义 
Window. cpp 给 出 Window, h 中 函数 的 定义 
GUL cpp 给 出 GUL h 中 函数 的 定义 
除 图 形 类 以 外 , 我们 还 设计 了 一 个 用 于 保存 Shape 或 者 Widget 的 容器 类 ; 
Shape 或 Widget 的 容器 
Vector_ref 向 量 ， 其 接口 便于 保存 未 命名 的 元 素 


当 你 阅读 下 面 几 节 时 , 请 不 要 太 快 。 虽 然 并 没有 什么 困难 的 内 容 , 但 本 章 的 目的 不 是 向 你 展示 一 
些 漂亮 的 图 片 一 一 你 每 天 都 会 在 自己 的 计算 机 屏幕 上 或 电视 上 看 到 更 漂亮 的 图 片 , 本 章 的 重点 
在 于 : 
。 展示 代码 和 它 生 成 的 图 片 之 间 的 关系 。 
e 让 你 习惯 阅读 代码 ,思考 代码 是 如 何 工作 的 。 
。 让 你 考虑 代码 的 设计 , 特别 是 如 何在 代码 中 用 类 来 表示 各 种 概念 。 为 什么 这 样 设计 那些 
类 ? 还 能 怎样 设计 ? 在 设计 中 我 们 做 出 了 很 多 很 多 决定 , 其 中 大 多 数 都 可 以 给 出 同样 合 
理 的 但 不 同 的 决定 , 在 某 些 情况 下 甚至 可 以 彻底 不 同 。 
因此 , 请 不 要 着 急 , 否则 你 将 会 漏 掉 一 些 重要 的 内 容 , 因而 可 能 觉得 习题 很 难 。 


13.2 Point 和 Line 
在 任何 图 形 系 统 中 , 点 (point ) 都 是 最 基本 的 组 成 部 分 。 定 义 点 就 是 定义 我 们 如 何 来 组 织 几 何 
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空间 。 在 这 里 , 使 用 人 们 习惯 的 面向 计算 机 的 二 维 布局 的 点 的 定义 : 整数 坐标 (x, y) 。 如 12.5 市 
的 描述 ,x 坐标 从 0( 屏 幕 的 左边 界 ) 到 x_max( ) (屏幕 的 右边 界 ) 7 华 标 从 0( 屏 萌 的 上 边界 ) 到 | y- 
max( ) (有 屏 问 的 下 边界 )。 

如 头 文件 Point. h 中 定义 ， Point 用 一 对 整数 ( 沧 标 什 ) 表示: 


struct Point { 
int x, y; 
Point(int xx, int yy) : x(xx), y(yy) { } 
Point() :x(0), y(0) { } 

}; 


bool operator==(Point a, Point b) { return a.x==b.x && a.y==b.y; } 


bool operator!=(Point a, Point b) { return 1(a==b); } 


Graph. h 还 定义 了 Shape( 将 在 第 14 章 详细 介绍 ) 和 Line: 

struct Line : Shape { /a Line is a Shape defined by two Points 

Line(Point p1, Point p2); /construct a Line from two Points 

}; | 
“ ;Shape” 表 示 Line 是 一 种 Shape ，Shape 称 为 Line 的 基 类 (base class) 或 简称 为 基 (base) 。 基本 上 ， 
Shape 提供 了 一 些 能 使 Line 的 定义 更 为 简单 的 特性 。 当 我 们 觉得 需要 特殊 形状 , 如 Line 和 Open- 
polyline 时 ,我 们 将 会 对 此 进行 解释 (参见 第 14 章 )。 

Line 由 两 个 Point 定义 。 下 面 代 码 创建 了 Line 对 象 , 并 将 其 绘制 出 来 , 我 们 省 略 了 “基本 框 


架 ”(#include 等 语句 ,参见 12. 3 节 )、 
/draw two lines 


Simple_window win1(Point(100,100),600,400, "two lines"); 


Line horizontal(Point(100,100),Point(200,100)); /make a horizontal line 
Line vertical(Point(150,50),Point(150,150)); I make a vertical line 


winl1.attach(horizontal); ~ //attach the lines to the window 
win1.attach(vertical); 


win1.wWait_for_button(); ~ /displayi 


执行 结果 如 下 : 





Line 的 设计 目标 就 是 尽量 简单 , 因此 可 以 工作 得 很 好 , 对 此 你 不 必 怀 疑 ; 

Line vertical(Point(150,50),Point(150,150)); | 
这 条 语句 创建 一 条 从 点 (1$0, 50) 到 点 (150, 150) 的 垂直 线 。 当 然 , 我 们 还 不 知道 Line 的 实现 细 
节 , 但 创建 Line 对 象 时 不 必 了 解 这 些 信息 。 实 际 上 ,Line 的 构造 函数 的 实现 非常 简单 


Line::Line(Point p1, Point p2) ~ // tonstruct a line from two points 
{ 

add(pT); /add pl to this shape 

add(p2); /add p2 to this shape 
} . 


也 就 是 说 ,构造 函数 只 是 简单 地 “添加 ”了 两 个 点 。 但 是 , 添加 到 哪里 ? Line 又 是 如 何在 窗口 中 绘 
制 出 来 的 ? 答案 就 在 Shape 类 中 。 我 们 将 在 第 14 章 对 此 进行 介绍 , 现在 你 只 需要 了 解 ，Shape 能 
够 保存 定义 线 的 点 , 知道 如 何 绘制 点 对 构成 的 线 , 而且 提 供 了 函数 add( ) 实 现 将 对 象 添加 到 Shape 
中 。 此 处 的 关键 点 是 ，Line 的 定义 非常 简单 。 大 多 数 实现 细节 都 已 由 “系统 ” 完成 了 , 因此 我 们 可 
以 将 精力 集中 于 编写 易于 使 用 的 类 。 

从 现在 开始 我 们 将 忽略 Simple_window 的 定义 和 attach( ) 的 调用 。 虽 然 它 们 对 于 完整 的 程序 
来 说 是 必 不 可 少 的 框架 , 但 对 具体 Shape 的 讨论 却 没有 什么 意义 。 


13.3 Lines 


事实 上 , 我 们 很 少 仅仅 绘制 一 条 线 。 通常 我 们 思考 的 问题 都 是 针对 包含 很 多 线 的 对 象 , 如 
三 角形 、 多边 形 、 路径 、 迷宫 、 网 格 、 柱 状 图 、 数 学 函数 、 数据 图 等 。 最 简单 的 “复合 图 形 对 象 
类 ”是 Lines: 


struct Lines : Shape{  //related jines 

void draw_jines() const; 

void add(Point p1, Point p2); // add a line defined by two points 
}»; 


Lines 对 象 是 简单 的 线 的 集合 ， 每 条 线 由 一 对 Point 定义 。 例 如 , 将 13. 2 节 的 Line 的 例子 中 的 两 条 
近 作 为 年 个 图 形 鸡 象 的 组 大 评分 ， 人 它们 : 


Lines x; . 
x.add(Point(100,100), poinit(200, 100)); 1 first line: honzoral 
x.add(Point(150,50), Point(150,150)); / second line: vertical 


其 输出 结果 很 难 与 Line 的 例子 区 分 开 来 ， 如 右 图 所 示 。 能 旱 
办 别 出 来 这 个 窗口 与 13.2 节 中 的 窗口 不 同 的 叭 一 一 途径 是 两 | 
者 的 标签 不 同 。 | 
一 组 Line 对 象 和 Lines 对 象 中 的 一 组 线 的 区 别 完 全 是 | 
我 们 看 问题 视角 的 不 同 。 使 用 Lines, 我 们 是 想 表达 两 条 线 ， 
是 联系 在 一 起 的 , 必须 一 起 处 理 。 例 如 ; 我 们 使 用 单个 命令 i 
就 可 以 改变 Lines 对 象 中 所 有 线 的 颜色 。 而 另 一 方面 , 我 们 “ Re 
却 可 以 为 不 同 的 Line 对 象 设置 不 同 的 颜色 。 一 个 更 实际 的 例子 的 是 如 何 定义 网 格 。 网 格 是 由 许 
多 等 间隔 的 水 平 线 和 垂直 线 构 成 的 。 但 是 , 我们 将 网 格 视 为 一 个 整体 ,于 是 我 们 将 这 些 水 平 线 和 
垂直 线 定义 为 一 个 名 为 grid 的 Lines 对 象 的 组 成 部 分 : 


int x_size = win3.x. max(); -. // get the size of our window 
int y_size = win3.y_max(); 

int x_grid = 80; 

int y_grid = 40; 





Lines grid; 

for (int x=x_grid; x<x_size; x+=x_grid) 
grid.add(Point(x,0),Point(x,y_size)); // vertical line 

for (int y =y_grid; y<y_size; y+=y_grid) 
grid.add(Point(0,y),Point(x_size,y)); / horizontal line 
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注意 , 这 里 使 用 x_max( ) 和 y_max( ) 获得 窗口 的 尺寸 ， ee 
对 于 本 例 , 使 用 一 组 Line 对 象 的 方式 , 为 每 条 网 格 线 
定义 一 个 命名 变量 , 显然 是 无 法 忍受 的 , 使 用 一 个 
Lines 对 象 是 更 适合 的 方式 。 这 段 代码 执行 结果 如 右 
图 所 示 。 
让 我 们 重新 加 到 Lines 的 设计 。Lines 类 的 成 员 
函数 是 如 何 实现 的 呢 ? Lines 只 提供 了 两 种 操作 ， 
add( ) 盟 数 将 一 条 线 ( 用 一 个 点 对 定义 ) 添 加 到 要 显 


示 的 线 集合 中 : 
void Lines: :add(Point p1, Point p2) 
{ 





Shape::add(p1); 
Shape: :add(p2); 
} 


add( pl ) 前 需要 加 Shape :: 限定 符 , 否则 编译 器 将 会 调用 Lines 类 的 add( ) 函数 (非法 的 ) 而 不 是 
Shape 类 的 add( ) 函数 。 
draw_lines( ) 函数 绘制 add( ) 定义 的 线 : 


void Lines: :draw_lines{) const 


{ 
if (color().visibility()) 
for (int i=1; i<number_of_points(); i+=2) 
fl_line(point(i—1).x,point(i—1).y,point(i).x,point(i).y); 
} ; 


Lines :: draw_lines( ) 一 次 获取 两 个 点 (从 点 0 和 1 开始 ), 并 使 用 底层 的 画 线 库 函 数 (f1_Line( ) ) 绘 
制 两 点 之 间 的 线 。 可 见 性 是 Lines 类 的 Color 对 象 的 一 个 属性 (参见 13.4 节 ) , 所 以 我 们 必须 在 画 
线 之 前 判断 其 可 见 性 。 

如 第 14 章 所 述 ，draw_lines( ) 是 被 “系统 ”调用 的 。 我 们 不 需要 检查 点 的 数目 是 否 为 偶数 ， 因 
为 Lines 类 的 add( ) 函数 每 次 严格 添加 两 个 点 。Shape 类 定义 了 number_of_points( ) 孙 数 和 point( ) 
晴 数 (参见 14.2 节 ), 它们 以 只 读 方 式 访问 Shape 的 点 。 因 为 成 员 函 数 draw_lines( ) 不 修改 形状 ， 
因此 将 其 定义 为 const 类 型 (参见 9.7.4 节 )。 

我 们 没有 为 Lines 提供 构造 函数 ,因为 以 空 形状 开始 ， 根据 需要 逐步 添加 点 的 方式 更 加 灵活 。 
我 们 当然 可 以 为 一 些 简单 情况 提供 构造 函数 (如 包含 1 条 线 、2 条 线 和 3 条 线 ) 或 者 任意 指定 数量 
的 线 , 但 实际 意义 并 不 大 。 这 也 是 一 个 基本 设计 原则 ,如 果 有 疑问 , 就 不 要 添加 功能 。 因 为 如 果 
确定 了 需要 这 种 功能 , 可 以 随时 添加 , 但 是 移 除 一 个 已 经 使 用 的 功能 是 很 困难 的 。 


13.4 Color 
Color 是 用 于 表示 颜色 的 类 型 ,其 使 用 方法 为 : 


grid.set_color(Color: :red); 


该 语句 将 grid 中 的 线 设置 为 红色 ,于 是 我 们 得 到 右面 的 图 。 
Color 定义 了 颜色 的 概念 ， 给 出 了 一 些 常 用 颜色 的 符号 
名 称 : 


struct Color { 


enum Color type { 
red=FL_RED, 





blue=FL_ BLUE， 
green=FL_GREEN, 
yellow=FL_YELLOW, 
white=FL_WHITE, 
black=FL_ BLACK, 
magenta=FL_MAGENTA, 
cyan=FL_CYAN, 
dark_red=FL DARK_RED, 
dark_green=FL_ DARK._GREEN, 
dark_yellow=FL_DARK_YELLOW 
dark_blue=FL_DARK_BLUE, 
dark_magenta=FL DARK_ MAGENTA, 

dark_cyan=FL_DARK_CYAN 

) 


enum Transparency { invisible = 0, visible=255 }; 


Color(Color_type cc) :c(FL Color(cc)), v(visible) {} 
Color(Color_type cc, Transparency vv) :c(FI_Color(cc)), v(vv) { } 
Color(int cc) :c(F_Color(cc)), v(visible) { } 

Color(Transparency vv) :c(Fl_Color0), v(vv) {}  / default color 


int as_int() const { return c; } 
char visibility() const { return v; } 


void set_visibility(Transparency vv) { v=vv; } 
private: 


charv; /invisible and visible for now 
Fl_Color c; 
}; 
Color 的 目标 是 : 


。 隐藏 颜色 的 实现 方式 : FLTK 的 也 _Color 类 型 。 
。 给 定 颜色 常量 的 范围 。 
。 提供 一 个 简单 的 透明 性 机 制 ( 可 见 的 和 不 可 见 的 ) 。 
你 可 以 按照 以 下 方式 选择 颜色 : 
。 从 命名 颜色 列表 中 选择 , 例如 Color :: dark_blue。 
。 从 一 个 小 的 “ 调 色 板 ” 中 选择 , 通过 指定 0 ~ 255 之 间 的 一 个 值 , 大 多 数 颜 色 都 能 很 好 地 在 
屏幕 上 显示 。 例 如 ，Color(99 ) 为 暗 绿色 , 代码 实例 参见 13. 9 节 。 
。 从 RGB( 红 、 绿 、 蓝 ) 系 统 中 选择 一 个 值 , 我 们 不 对 这 种 方法 进行 详细 介绍 , 若 需 要 可 以 查 
阅 相关 资料 。 特 别 是 ， 在 互联 网 中 搜索 “RGB color”, 会 找到 很 多 资源 ， 比 如 
www. hypersolutions. org/rgb. html 和 www. pitt. edu/ ~ nisg/cis/web/cgi/ rgb. html。 (参见 习 
题 13 和 14。) 
注意 , 构造 函数 可 以 利用 Color_type 或 者 普通 的 int 来 创建 Color 所 有 版 本 的 构造 函数 都 将 初始 
化 成 员 变量 c。 你 可 能 认为 c 这 个 名 字 太 短 、 太 模糊 , 但 由 于 它 只 在 Color 内 部 很 小 的 作用 域内 
使 用 , 不 会 用 于 更 一 般 的 用 途 , 所 以 应 该 没有 问题 。 在 我 们 的 设计 中 , 数据 成 员 e 被 声明 为 私 
有 的 , 以 避免 用 户 直 接 使 用 它 ; 它 的 类 型 被 声明 为 FLTK 中 的 有 _Color 类 型 一 一 我 们 不 希望 将 
Fl_Color 呈现 给 用 户 。 但 是 , 将 颜色 看 做 int 值 (表示 其 RGB (或 其 他 颜色 系统 ) 值 ) 是 很 常见 
的 ,所 以 我 们 提供 了 as_int( ) 函数 。 因 为 as_int( ) 函数 不 会 真正 改变 Color 对 象 , 故 将 其 定义 为 
常量 成 员 函 数 。 
成 员 变 量 v 的 取 值 为 Transparency :: visible 和 Transparency :: invisible ， 表 示 颜 色 的 透明 性 (可 
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见 的 或 者 不 可 见 的 )。 你 可 能 觉得 “不 可 见 的 颜色 ”很 奇怪 , 但 需要 将 复合 形状 的 某 一 部 分 置 为 不 
可 见 时 , 这 种 方式 很 有 效 。 


13.5 Line_style 


在 一 个 窗口 中 绘制 多 条 线 时 , 可 以 通过 颜色 、 线 型 
或 两 者 结合 将 它们 区 分 开 来 。 线 型 是 用 来 描述 线 的 外 形 
的 一 种 模式 , 使 用 方法 如 下 ; 

grid.set_style(Line_style: :dot); 
这 条 语句 将 grid 中 的 线 显 示 为 点 状 线 而 非 实 线 , 如 右 图 所 
示 。 这 使 得 网 格 看 起 来 变 “ 稀 玖 ”7 了, 更 离散 了 。 我 们 还 可 
以 调整 线 宽 ( 粗 细 ) ， 以 使 网 格 线 达 到 我 们 的 喜好 和 要 求 。 


Line_style 类 型 的 定义 如 下 : 


struct Line_style { 
enum Line_style_type { 





solid=FL_SOLID, {/ ------- 
dash=FL_DASH, / ---- 
dot=FL_DOY, 人 
dashdot=FL_DASHDOT / -.,-， 


dashdotdot=FL_DASHDOTDOT, 1 = 
}; 


Line_styie(Line_style_type ss) :s(ss), w(0) {} . 
Line_style(Line_style_type st, int ww) :s(lst), w(ww) {} 
Line_style(int ss) :s{ss), w(0) {} 
int width() const { return w; } 
int style() const { return s; } 
private:; 
int s; 
int w; 


}; 
定义 Line_style 所 使 用 的 程序 设计 技术 与 Color 的 定义 完全 一 样 。 我 们 隐藏 了 FLTK 使 用 普通 int 
型 值 表 示 线 型 的 细节 , 为 什么 这 样 做 呢 ? 因 为 这 些 实现 细节 很 可 能 随 着 库 的 升级 而 发 生变 化 。 
一 个 FLTK 版 本 完全 可 能 有 专门 的 妃 _linestyle 类 型 ,我们 也 完全 有 可 能 使 用 其 他 CUI 库 而 不 是 
FLTK 来 设计 接口 类 。 无 论 哪 种 情况 , 我 们 都 不 希望 我 们 的 代码 或 者 用 户 的 代码 充斥 着 使 用 普通 
int 值 表示 线 型 的 片段 , 否则 就 需要 随 着 库 的 变化 进行 大 幅度 修改 。 

大 多 数 情况 下 , 我 们 完全 无 需 担 心 线 型 , 使 用 默认 线 型 就 可 以 了 (默认 宽度 和 实 线 )。 如 果 我 
们 没有 显 式 指定 线 宽 , 构造 函数 会 设 定 默认 线 宽 。 设 定 默 认 值 是 构造 函数 所 擅长 的 工作 , 而 恰当 
的 默认 值 对 用 户 会 有 很 大 帮助 。 

注意 , Line_style 有 两 个 分 量 : 模式 (如 虚线 或 实 线 ) 和 竟 度 ( 线 的 粗细 )。 i I 
认 值 为 1。 我 们 可 以 这 样 来 设置 粗 虚 线 : 

grid.set_style(Line_style(Line_styfe::dash,2)); 
运行 结果 如 右 图 所 示 。 注 意 , 颜色 和 线 型 设 定 会 对 形状 中 
所 有 线 起 作用 , 这 是 将 许多 线 组 合 为 单个 图 形 对 象 (例如 
Lines、Open_polyline 或 Polygon ) 的 好 处 之 一 。 如 果 我 们 想 
分 别 控制 线 的 颜色 或 线 型 ,必须 将 它们 定义 为 独立 的 Line 
对 家 。 例如 : : 
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horizontal,set_color(Color::red); 
vertical.set_color(Color: ;green); 


运行 结果 如 下 : 





13.6 Open_polyline 


n_polyline 是 由 依次 相连 的 线 的 序列 组 成 的 形状 , 由 一 个 点 的 序列 定义 poly 一 词 来 源 于 
希腊 语 , 表示 “很 多 ”,， polyline 是 表示 由 许多 线 组 成 的 形状 的 常用 术语 。 例 如 : 


Open_polyline opl; 

opl.add(Point(100,100)); 

opl.add(Point(150,200)); 
opl.add(Point(300,200)); 





rt ral 


连接 所 有 的 点 可 得 到 如 上 图 所 示 的 形状 。 基 本 上 ，Open_polyline 不 过 是 我 们 在 幼儿 园 时 的 “点 连 
线 ” 游 戏 的 好 听 一 点 的 说 法 罢了 。 

Open_polyline 类 的 定义 如 下 ; 

struct Open_polyline : Shape{  //open sequence of lines 

曙 void add(Point p) { Shape: :add(p); } 
是 的 , 这 就 是 Open_polyline 的 完整 定义 。 从 程序 文本 上 看 , 除了 名 称 和 从 Shape 继承 来 的 内 容 外 ， 
Open_polyline 没有 定义 什么 新 的 东西 。 唯 一 的 新 成 员 是 add( ) 函数 , 它 也 只 是 简单 地 调用 Shape 
类 的 add( ) 函数 ( 即 Shape :: add( ) ) 。 我 们 甚至 不 必定 义 draw_lines( ) ， 因 为 Shape 类 默认 情况 下 
会 将 add( ) 函数 添加 进来 的 Point 解释 为 依次 连接 的 线 的 序列 。 


13.7 Closed_polyline 


Closed_polyline 与 Open_polyline 很 相似 , 唯一 不 同 之 处 就 是 还 要 画 一 条 从 最 后 一 个 点 到 第 一 
个 点 的 线 。 例 如 , 使 用 与 13. 6 节 的 Open_polyline 相同 的 点 构造 一 个 Closed_polyline: 

Closed_polyline cpl; 

cpl.add(Point(100,100)); 

cpl.add(Point(150,200)); ) 

cpl.add(Point(250,250)); 

cpl.add(Point(300,200)); 
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除了 最 后 的 闭合 线 之 外 , 结果 ( 当然 ) 与 13. 6 节 的 例子 完全 相同 : 





Closed_polyline 的 定义 为 ， 


struct Closed_polyline : Open_pokyline {  //closed sequence of lines 
void draw_lines() const; 


)}; 


void Closed_polyline::draw_lines() const 
{ 
Open_polyjine::draw_iines(0); /first draw the “open polyline part” 
// then draw closing line: 
if (color().visibilityO) 
fl line(point(number_of_points(O)—1).x, 
Point(numjber_ of points(0-1).Y 
point(0).x, 
point(0).y); 
} 


我 们 需要 为 Closed_polyline 定义 自己 的 draw_lines( ) 晒 数 , 来 绘制 最 后 一 个 点 到 第 一 个 点 之 间 的 闭 
合 线 。 幸 运 的 是 , 我 们 只 要 编写 完成 Closed_polyline 与 Open_polyline 不 同 的 那 部 分 代码 即 可 。 这 
是 一 种 重要 的 程序 设计 技术 ， 有 时 称 为 “差异 程序 设计 ”一 一 我 们 只 需 为 派生 类 (本 例 中 的 Closed_ 
polyline) 和 基 类 (本 例 中 的 Open_polyline) 的 差异 编写 代码 。 

那么 , 我 们 如 何 绘制 闭合 线 呢 ? 我 们 使 用 FLTK 的 画 线 函数 fl_line( ) 来 完成 这 一 工作 。 它 接 
受 4 个 整 型 参数 , 表示 两 个 点 。 我 们 这 里 再 次 用 到 了 底层 的 图 形 库 。 但 是 , 请 注意 , 与 其 他 例子 
一 样 , 我 们 只 是 在 类 的 实现 中 使 用 了 FLTK, 并 没有 将 它 暴 露 给 用 户 。 任 何 用户 代 码 都 无 须 引用 卫 
_line( ) 函数 , 或 是 了 解 用 整数 隐 式 表示 点 这 类 细节 。 这 样 ， 当 我 们 需要 时 , 就 可 以 用 其 他 GUI 库 
替代 FLTK, 而 对 用 户 代 码 几 乎 不 会 有 任何 影响 。 


13.8 Polygon 


Polygon 与 Closed_polyline 非常 相似 , 唯一 的 区 别 是 Polygon 不 允许 出 现 交叉 的 线 。 例 如 , 13.7 


节 中 的 Closed_polyline 是 一 个 多 边 形 , 但 如 果 再 添加 一 个 点 : 
cpl.add(Point(100,250)); 


运行 结果 如 右 图 所 示 。 根 据 经 典 几 何 定 义 , 这 个 Closed_ 
polyline 就 不 是 多 边 形 了 。 那 么 ， 如 何 定义 Polygon 才能 正 
确 利 用 与 Closed_polyline 之 间 的 关系 ， 又 不 违反 几何 规则 ? 
前 文中 有 一 个 强烈 的 暗示 : Polygon 是 不 存在 交叉 线 的 
Closed_polygon。 换 句 话 说 , 我 们 就 可 以 强调 由 点 建立 形状 
的 过 程 ， 如果 新 添加 的 Point 定义 的 线段 不 与 Polygon 任何 








现 有 的 线 相 交 时 , 这 样 的 Closed_polyline 就 是 Polygon。 
由 此 可 定义 Polygon 如 下 : 
struct Polygon : Closed_polyline { // closed sequence of nonintersecting lines 
void add(Point p); 
void draw_jines() const; 
} 
void Polygon::add(Point p) 
{ 
// check that the new jine doesn't intersect existing lines 
Closed_polyline::add(p); 
} 


我 们 继承 了 Closed_polyline 中 draw_lines( ) 函数 的 定义 , 这 不 但 节省 了 工作 量 , 还 避免 了 重复 代 
码 。 不 幸 的 是 , 每 次 调用 add( ) 时 , 我 们 都 需要 检查 是 否 有 线段 交叉 。 这 导致 一 个 低 效 的 (平方 阶 
的 ) 算 法 一 一 定义 一 个 由 入 个 点 构成 的 Polygon 时 , 需 调 用 NN# (和 -1)72 次 intersect( ) 函数 , 因此 
算法 的 时 间 复 杂 度 为 N 的 平方 阶 。 在 实际 应 用 中 , 我 们 假设 Polygon 类 只 用 于 顶点 数 比 较 少 的 多 
边 形 。 例 如 , 创建 一 个 24 个 Point 的 Polygon 需要 调用 intersect( ) 末 数 24* (24 -1)/2 ==276 次 ， 
这 应 该 是 可 以 接受 的 , 但 如 果 创 建 由 2000 个 顶点 构成 的 多 边 形 则 需要 大 约 2 000 000 次 函数 调用 ， 
可 能 需要 寻找 更 优 的 算法 ,接口 可 能 也 需要 相应 修改 。 

无 论 如 何 , 我 们 可 以 这 样 创建 多 边 形 : 

Polygon poly; 

poly.add(Point(100,100)); 

poly.add(Point(150,200)); 


poly.add(Point(250,250)); 
poly.add(Point(300,200)); 


显然 , 该 代码 创建 了 一 个 与 13.7 节 的 Closed_poly- i 
line 等 价 的 Polygon， 如 右 图 所 示 。 确 保 Polygon 真正 
表示 多 边 形 是 极其 棘手 的 ，Polygon :: add( ) 函数 中 省 
略 的 相交 检查 是 整个 图 形 库 中 最 复杂 的 部 分 。 如 果 
你 对 高 精度 几何 坐标 计算 感 兴趣 ,可 以 研究 一 下 它 
的 代码 。 即 使 解决 了 相交 检查 ,多边 形 判 定 仍 没有 
彻底 解决 。 考 虑 创建 只 有 两 个 点 的 多 边 形 的 请 求 ， 
我 们 显然 应 该 阻止 这 种 情况 : 


void Polygon::draw_lines() const 
{ 





if (number_of_points() < 3) error("less than 3 points in a Polygon"); 
Closed_polyline::draw_lines(); 
}) 


我 们 要 做 的 实际 上 是 要 保证 Polygon 的 不 变 式 “ 这 些 点 表示 一 个 多 边 形 ”, 但 坏 手 的 是 ， 只 有 年 义 
了 所 有 点 之 后 才能 验证 这 个 不 变 式 。 也 就 是 说 , 我 们 不 能 在 构造 孙 数 中 建立 Polygon 的 不 变 式 ， 
虽然 这 是 最 好 的 方式 。 将 “至 少 3 个 点 ”的 检测 置 于 Polygon :: draw_lines( ) 函数 中 也 是 一 种 无 宗之 
举 (参见 习题 18)。 


13.9 Rectangle 


在 屏幕 上 最 常见 的 形状 是 矩形 ,部 分 是 因为 文化 (大 多 数 门 、 窗 、 照 片 、 墙 、 书柜 、 页 等 都 是 
矩形 的 ) ， 部 分 是 因为 技术 (保证 坐标 位 于 矩形 空间 内 ， 比 任何 其 他 形状 都 简单 ) 。 无 论 如 何 . 乍 
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形 是 如 此 常见 , 因而 GUI 系统 直接 支持 矩形 , 而 不 是 把 它们 当做 4 个 角 都 是 直角 的 多 边 形 。 


struct Rectangle : Shape { 
Rectangle(Point xy, int ww , int hh); 
Rectangle(Point x, Point y); 
void draw_lines() const; 


int height() const { return h; } 

int width() const { return w; } 
private: 

int h; /height 

int w; / width 


}; 
使 用 两 个 项 点 (左上 角 和 右 下 角 ) ,或 者 一 个 顶点 (左上 角 ) 和 宽度 、 高 度 就 可 以 定义 矩形 。 构 造 函 
数 可 以 定义 如 下 : 
Rectangle::Rectangle(Point xy, int ww, int hh) 
: w(ww), h(hh) 
{ : 
if (h<=0 || w<=0) 
error("Bad rectangle: non-positive side"); 
add(xy); 
} 


Rectangle::Rectangle(Point x, Point y) 
:Ww(y.x—x.x), h(y.y—x.y) 


{ 
if (h<=0 || w<=0) 
error("Bad rectangle: non-positive width or height"); 
add(x); 
} 


每 个 构造 函数 都 会 恰当 地 对 成 员 变 量 h 和 w 进行 初始 化 (使 用 成 员 初始 化 列表 , 参见 9.4.4 节 )， 
并 将 矩形 左上 角 点 保存 在 Rectangle 的 基 类 Shape 中 (使 用 add( ) ) 。 此 外 , 还 进行 了 完整 性 检查 : 
我 们 当然 不 希望 Rectangle 的 高 度 和 宽度 是 负数 。 

一 些 图 形 /GUI 系统 对 矩形 特殊 对 待 的 原因 之 一 是 , 判断 哪些 像素 位 于 矩形 内 部 的 算法 要 比 Pol- 
ygon 和 Circle 等 其 他 形状 简单 得 多 , 因而 也 快 得 多 。 因 此 , 对 于 和 矩形 ,“ 填 充 ” 操 作 一 一 也 就 是 将 区 
域内 的 像素 设置 为 指定 颜色 的 操作 很 常用 , 而 其 他 形状 则 较 少 应 用 这 个 操作 。 我 们 可 以 在 构造 函数 
中 设 定 填充 颜色 , 或 者 用 set_fill_color( ) 函数 进行 设 定 ( Shape 类 提供 的 颜色 相关 的 操作 之 一 ) : 


Rectangle rect00(Point(150,100),200,100); 

Rectangle rect11(Point(50,50),Point(250,150)); 

Rectangle rect12(Point(50,150),Point(250,250)); /just below rect11 
Rectangle rect21(Point(250,50),200,100); / just to the right of rect1] 
Rectangle rect22(Point(250,150),200,100); // just below rect2]1 


rect00.set _fill_color(Color: ;yellow); 
rect11.set_fill_color(Cotlor: :blue); 
rect12.set fill_color(Color: :red); 
rect21.set_fill_color(Color::green); 


运行 结果 如 右 图 所 示 。 当 不 设 定 填充 颜色 时 , 矩形 是 
透明 的 , 这 也 是 在 右 图 中 你 可 以 看 到 黄色 矩形 rect00 
的 一 角 的 原因 。 

你 可 以 在 窗口 内 部 随意 移动 形状 (参见 14.2.3 节 )， 
例如 : 





1 一 蓝 色 2 一 绿色 3 一 红色 ”4 一 黄色 
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rect11,move(400,0); // to the right of rect2 1 
rectit.set fill_color(Color: :white); 
win12.set_label("rectangles 2"); 


运行 结果 ,如 右 图 所 示 。 注 意 , 白色 和 矩形 rectll 只 
有 一 部 分 位 于 窗口 之 内 , 位 于 窗口 之 外 的 部 分 被 
“剪裁 " 掉 了 , 不 会 在 屏幕 上 显示 。 

另外 请 注意 形状 的 层次 , 一 个 形状 是 如 何 放置 
在 男 一 个 的 上 层 的 。 这 与 你 将 几 张 纸 放 在 桌子 上 是 
一 样 的 , 最 先 放下 的 那 张 纸 位 于 最 底层 。 我 们 的 
Window 类 (参见 附录 E. 3 ) 提供 了 一 种 重 排 形状 次 
序 的 简单 方法 , 可 以 使 用 Window :: put_on_top( ) 郴 
数 通 知 窗口 将 一 个 形状 放 在 最 顶层 。 例 如 : 


win12.put_on_top(rect00); 
win12.set_lJabel("rectangles 3"); 


运行 结果 为 : 








1 一 红色 2 一 黄色 3 一 绿色 4 一 白色 


注意 , 尽管 矩形 被 填充 了 某 种 颜色 (除了 一 个 之 外 ), 但 仍然 可 以 看 到 它们 的 边框 。 如 果 不 需 要 ， 
可 以 将 其 去 掉 : 


rect00.set_color(Color: :invisible); 
rectii.set_color(Color: :invisible); 
rect12.set_color(Color: :invisible); 
rect21.set_color(Color: :invisible); 
rect22.set_color(Color: :invisible); 


运行 结 采 为 : 








1 一 红色 2 一 黄色 3 一 绿色 4 一 白色 
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注意 , 在 填充 颜色 和 线 的 颜色 都 被 设置 为 invisible 后 , 矩形 rect22 就 看 不 到 了 。 
由 于 Rectangle 的 draw_lines( ) 函数 必须 处 理 线 的 颜色 和 填充 颜色 ,因此 实现 变 复 杂 了 : 


void Rectangle::draw_lines() const 
{ 
if (fill_color().visibilityO) { Wfil 
fl_color(fill_color().as_int()); 
fl_rectf(point(0).x,point(0).y,w,h); 
} 


if (color() .visibitity()) { / lines on top of 全 
fl_color(color().as_intO)); 
fl_rect(point(0).x,point(0).y,w,h); 

} 

} 


如 你 所 见 ，FLTK 提供 了 绘制 填充 矩形 (1f1_rectf( ) ) 和 短 形 边框 (f1_rect( ) ) 的 功能 。 在 我 们 的 代码 
中 , 默认 情况 下 两 者 均 被 绘制 。 


13. 10 ”管理 未 命名 对 象 


到 目前 为 止 , 我 们 使 用 的 都 是 命名 图 形 对 象 。 当 处 理 大 量 对 象 时 , 这 种 方法 不 再 可 行 。 例 
如 , 绘制 FLTK 调 色 板 中 256 种 颜色 构成 的 比 色 图 表 ， 
即 绘制 256 个 不 同 颜色 填充 的 格子 , 构成 一 个 16 x 16 
的 颜色 矩阵, 来 显示 相近 的 颜色 值 对 应 什么 颜色 。 首 先 
给 出 结果 ,如 右 图 所 示 。 命 名 256 个 格子 不 但 繁琐 ， 而 
且 相 当 不 明智 。 左 上 角 格 子 的 一 个 显然 的 “命名 ”方式 
是 它 在 矩阵 中 的 位 置 (0, 0) , 其 他 任何 一 个 格子 都 可 以 
由 其 坐标 (i, j) 进行 标识 (“命名 ”) 。 我 们 在 本 例 中 需要 
做 的 是 找到 一 种 表示 对 象 矩 阵 的 方法 。 我 们 考虑 过 使 
用 vector < Rectangle > , 但 实践 证 明 不 够 灵活 。 例 如 , 不 同类 型 未 命名 对 象 ( 元素) 的 集合 应 该 
一 种 很 有 用 的 功能 , 但 vector 无 法 实现 。 我 们 将 在 14. 3 节 讨 论 灵活 性 问题 ， 0 
决 方案 : 采用 能 够 保存 已 经 命名 和 未 命名 对 象 的 向 量 类 型 : 


template<class T> class Vector_ref { 

public: 
1... 
void push_back(T&); /adda named object 
void push_back(T*)  //add an unnamed object 





T& operator[](int i); // subscripting: read and write access 
const T& operator[](int i) const; 


int size() const; 


}; 
与 标准 库 vector 的 使 用 方法 非常 类 似 : 


Vector_ref<Rectangle> rect; 


Rectangle x(Point(100,200),Point(200,300)); 
rect.push_back(x);  //add named 


rect.push_back(new Rectangle(Point(50,60),Point(80,90))); /add unnamed 


for (int i=0; i<rect.size(); ++i rect[i].move(10,10); // use rect 


我 们 将 在 第 17 章 解 释 new 操作 符 , 在 附录 中 给 出 Vector_ref 的 实现 。 现 在 ， 知道 可 以 用 它 保有 
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未 命名 对 象 就 够 了 。 操 作 符 new 后 面 是 类 型 名 称 (如 Rectangle) ， 然 后 是 可 喧 萎 始 化 列 帮 ( 台 
(Point(50, 60) ，Point(80, 90) ) ) 。 有 经 验 的 程序 员 可 以 放心 , 我 们 并 没有 引入 内 存 漆 温 问 题 . 
有 了 Rectangle 和 Vector_ref 以 后 , 我 们 接 下 来 就 可 以 处 理 颜 色 了 。 例如, 我 们 可 以 这 样 实现 
上 述 具 有 256 种 颜色 的 比 色 图 表 ， 
Vector_ref<Rectangle> vr; 
for (inti = 0; i<16; ++i) 
for (int j = 0; j<16; ++j) { 
vr.push_back(new Rectangle(Point(i*20,j*20),20,20)); 
vr[vr.size(}—1].set_fill_color(i*16+)); 


win20.attach(vr[vr.size()—1]); 
} 


这 段 代码 创建 了 一 个 保存 256 个 Rectangles 的 Vector_ref, 这些 矩形 在 Window 中 排列 为 16 x16 的 
和 矩阵。 我 们 将 矩形 的 颜色 设 定 为 0、.1、2、3 、4 等 。 创 建 一 个 矩形 后 ， 就 将 其 添加 到 窗口 中 ,显示 
结果 如 下 : 


i 


er 
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13. 11 Text 


很 明显 , 我 们 需要 在 图 形 显示 中 添加 文本 的 功能 。 例 如 , 为 13. 8 节 中 “奇怪 "的 Closed_poly- 


line 添加 标签 
Text t(Point(200,200),"A closed polyline that isn't a polygon'"); 
t.set_color(Color::blue); 


运行 结果 , 如 右 图 所 示 。 一 个 Text 对 象 定义 了 起 始 
位 置 为 Point 的 一 行文 本 , 其 中 Point 为 文本 行 的 左 
下 角 。 限 制 为 一 行文 本 的 原因 是 要 保证 跨 系统 的 可 
移植 性 。 不 要 尝试 在 字符 串 中 放 人 换行 符 , 在 窗口 
中 不 一 定 产 生 换 行 效 果 。 字 符 串 流 ( 参 见 11.4 市 ) 
对 于 构造 Text 对 象 中 的 字符 串 是 很 有 用 的 (例子 参 


见 12.7.7 和 12.7.8 节 )。Text 的 定义 如 下 : 
struct Text : Shape { 
// the point is the bottom left of the first letter 
Text(Point x, const string& s) 
: lab(s), fnt(fl_font()), fnt_sz(fl_size()) 
{add(x); } 





void draw _ lines() const; 
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void set_label(const string& s) {lab = s; } 
string label() const { return lab; } 


void set_font(Font f) {fnt =f;} 

Font font( const { return fnt ; } 

void set_font_sizel(int s) {fnt_sz = $s; } 
int font_size() const { return fnt_sz; } 


private: 
string lab; /label 
Font fnt; 
int fnt_sz; 

}; 


因为 只 有 Text 类 知道 其 字符 串 是 如 何 存储 的 , 所 以 Text 必须 有 自己 的 draw_lines( ) 隆 数 : 


void Text: :draw_lines() const 
{ 

fl_drawl(lab.c_str(),point(0).x,point(0).y); 
} 


字符 颜色 的 设置 类 似 于 形状 (如 Open_polyline 和 Circle) 中 线 的 颜色 的 设置 方法 , 你 可 以 用 set_col- 
or( ) 函数 选择 一 种 颜色 ， 用 color( ) 函数 获取 当前 使 用 的 颜色 。 字 号 和 字体 的 处 理 相似 , 下 面 列 出 


了 一 小 部 分 预定 义 字体 : 


class Font { // character font 
public: 
enum Font type{ 

hejivetica=FL_HELVETICA， 
helvetica_bold=FL_HELVETICA_BOLD, 
helvetica italic=FL_HELVETICA_[TALIC, 
helvetica_bold_italic=FL_HELVETICA_BOLD _jTALIC, 
courier=FL_COURIER, 
courier_bold=FL_COURIER_BOLD, 
courier_ italic=FL_COURIER_ITALIC, 
courier_bold italic=FL_COURIER_BOLD_ITALIC, 
times=FL_TIMES, 
times_bold=FL_TIMES_BOLD, 
times_italic=FL_TIMES_ITALIC， 


times_boid_itaiic=FL_TIMES_BOLD_ITALIC， 
symbol=FL_SYMBOL, 
screen=FL_SCREEN, 
screen_bold=FL_SCREEN_BOLD, 
zapf_dingbats=FL_ZAPF_DINGBATS 

}; | 


Font(Font type ff) :f(ff) {} 
Font(int ff) :f(ff) { } 


int as_int() const { return f; } 
private: 
int f; 


}; 


Font 类 的 定义 风格 与 Color( 参见 13.4 节 ) 和 Line_style( 参 见 13.5 节 ) 的 风格 是 一 样 的 。 


13. 12 Circle 


为 了 说 明 世 界 并 不 是 完全 由 和 矩形 构成 的 , 我 们 设计 了 Circle 类 和 Ellipse 类 。Cirele 是 由 圆心 


和 半径 定义 的 : 


Struct Circle : Shape { 
Circle(Point p, intrr);  // center and radius 


void draw _lines() const; 


Point center() const ; 

int radius() const { return r; } 

void set_radius(int rr) { r=rr; } 
private: 

int r; 


}; 
Cirele 类 的 使 用 方法 为 ; 


Circle c1(Point(100,200),50); 
Circle c2(Point(150,200),100); 
Circle c3(Point(200,200),150); 


上 述 语 句 产 生 圆 心 在 同一 水 平 线 上 的 三 个 不 同 半 
径 的 圆 , 运行 结果 ,如 右 图 所 示 。Circle 类 实现 的 
一 个 特别 之 处 是 , 它 所 存储 的 点 不 是 圆心 , 而 是 
圆 的 正方 边界 的 左上 角 。 我 们 本 来 可 以 将 两 个 点 
都 存储 起 来 , 但 最 终 选 择 了 存储 FLTK 最 优 画 
函数 所 使 用 的 那个 。Circle 提供 了 一 个 很 好 的 例 
子 , 展示 了 对 于 同一 个 概念 , 一 个 类 如 何 用 来 呈 
现 与 其 实现 不 同 的 (可 能 更 好 的 ) 视 角 。 


Circle::Circle(Point p, intrr} /center and radius 
sr(rr) 





add(Point(p.x—r,p.y—r)); /store top jeft corner 


} 
Point Circle: :center(0 const 
{ 
return Point(point(0).x+r, point(0).y+r); 
} 


void Circle::draw _ lines() const 


if (color().visibility()) 
fl_arc(point(0).x,point(0).y,r+r,r+r,0,360); 
} . s 
注意 , 如 何 使 用 fi_arc( ) 函数 绘制 圆 , 其 中 头 两 个 参数 表示 左上 角 , 接 下 来 两 个 参数 表示 外 接 拖 形 
的 宽度 和 高 度 , 最 后 两 个 参数 表示 绘制 的 起 止 角度 。 环 绕 360 度 才 绘制 出 一 个 圆 , 但 我 们 也 可 以 


用 fl_arc( ) 函数 绘制 部 分 圆 (椭圆 ), 参见 习题 1。 
13. 13 Ellipse 


椭圆 与 Circle 类 似 , 但 通过 长 轴 和 短 轴 定 义 , 而 不 是 半径 。 也 就 是 说 , 定义 椭圆 需要 给 出 圆 
心 坐标 以 及 从 圆心 到 x 轴 和 y 轴 与 椭 问 交点 的 距离 : 


struct Ellipse : Shape { 
Ellipse(Point p, int w int h); // center, max and min distance from center 


void draw_lines() const; 
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Point center() const; 
Point focus1() const; 
Point focus2() const; 


void set_major(int ww) { w=ww; } 
int major() const { return w; } 


void set_minor(int hh) { h=hh; } 
int minor( const { return h; } 
private: 
int w; 
int h; 
»; 
可 以 这 样 使 用 Ellipse 类 ， 
Ellipse el(Point(200,200),50,50); 
Eilipse e2(Point(200,200),100,50); 
Ellipse e3(Point(200,200),100,150); 
上 述 语句 产生 圆心 相同 、 长 轴 和 短 轴 不 同 的 三 个 
椭圆 , 运行 结果 ,如 右 图 所 示 。 注 意 , 长 轴 与 短 轴 
相等 (major( ) == minor( ) ) 的 椭圆 看 起 来 就 是 一 


个 圆 。 
为 一 种 表示 椭圆 的 常用 方法 是 指定 两 个 焦点 
和 从 一 个 点 到 两 个 焦点 的 距离 之 和 。 给 定 一 个 也 - 


lipse， 可 以 计算 出 一 个 焦点 。 例如 : 


Point Ellipse: :focus1() const 


{ 





return Point(center() .x+sgrt(double(w*w—h*h)),center().y) ; 


} 

为 什么 Circle 不 是 Ellipse? 从 几何 角度 看 ,， 圆 都 是 椭圆 ,但 椭圆 不 一 定 是 贺 。 特 别 地 ,， 圆 是 两 个 焦 
点 相同 的 椭圆 。 我 们 没有 把 Circle 定义 为 Ellipse,， 因 为 这 样 会 增加 一 个 成 员 ( 圆 由 圆心 和 半径 定义 ， 
椭圆 由 圆心 和 两 个 轴 定义 ), 带 来 额外 的 空间 开销 。 更 主要 的 原因 是 ,如 果 不 禁 止 set_major( ) 和 
set_minor( ) 国 数 ， 就 无 法 将 Circle 定义 为 Ellipse。 毕 竟 ， 如 果 我 们 使 用 set_major( ) 将 长 轴 设 置 得 
与 短 轴 不 相等 (major( ) ! = minor( ) ) ， 就 不 是 一 个 圆 了 (从 数学 家 的 角度 ) , 至少 在 设置 之 后 就 不 
再 是 圆 了 。 我 们 不 允许 对 象 的 类 型 发 生变 化 , 即 一 个 对 象 不 能 在 major( ) ! = minor( ) 时 是 椭圆 ， 而 
在 major( ) == minor( ) 时 又 是 圆 。 但 是 , 能 够 允许 的 是 一 个 Ellipse 对 象 有 时 看 起 来 像 是 圆 。 另 一 
方面 ，Circle 永远 不 会 变 成 两 个 轴 不 相等 的 椭圆 。 

在 设计 类 时 , 我 们 应 该 小 心 不 要 自作 聪明 , 也 不 要 被 “直觉 ”所 欺骗 ,以 至 于 设计 出 一 些 毫 无 
意义 的 “类 ”来 。 相 有 反 , 我 们 应 该 注意 如 何 用 类 表达 某 些 关系 密切 的 概念 , 不 能 设计 成 简单 的 数据 
和 哨 数 成 员 的 集合 。 不 思考 要 表达 的 思想 /概念 ,只 是 将 代码 简单 地 堆积 在 一 起 , 会 制造 出 我 们 
难以 解释 和 其 他 程序 员 难 以 维护 的 “黑客 代码 ”。 如 果 你 不 是 利他 主义 者 , 请 记 住 “其 他 程序 员 ” 
可 能 就 包括 几 个 月 之 后 的 你 。 另 外 ,这 种 代码 也 很 难 调试 。 


13. 14 Marked_polyline 


我 们 常常 需要 对 图 中 的 点 做 “标记 ”。 画 图 的 一 种 方式 是 开放 的 多 段 线 , 因此 我 们 只 需 “ 标 
记 开放 多 段 线 的 每 个 点 即 可 。Marked_polyline 就 能 实现 这 一 目的 , 例如 : 


Marked_polyline mpl("1234"); 
mpi.add(Point(100,100)); 
mpl.add(Point(150,200)); 
mpl.add(Point(250,250)); 
mpi.add(Point(300,200)); 


运行 结果 为 : 





Marked_polyline 的 定义 为 : 
struct Marked_polyline : Open_polyline { 
Marked_polyline(const string& m) :mark(m) {} 
void draw _lines() const; 
private: 
string mark; 


}; 
它 继承 了 Open_polyline 类 ,因此 “免费 ”实现 了 对 Point 的 处 理 , 我 们 只 需 添 加 处 理 标 记 的 代码 。 
特别 是 ，draw_lines( ) 函数 应 修改 为 : 


void Marked_polyline::draw_lines() const 


{ 
Open_polyline::draw_lines(); 
for (int i=0; i<number_of_points(); ++i) 
draw_mark(point(i),mark[i%omark. size()]); 
} 


调用 Open_polyline :: draw_lines( ) 负责 画 线 操作 ,因此 我 们 只 需 处 理 标记 。 我 们 将 标记 存储 为 一 个 字 
符 串 , 按 顺 序 选取 其 中 的 字符 : 在 创建 Marked_polyline 时 , 使 用 mark[ i9% mark. size( ) ] 选 择 下 一 个 显 
示 的 标记 字符 。 其 中 % 是 模 ( 取 余 ) 运 算 符 , 也 就 是 说 , 我 们 循环 使 用 数组 mark 来 选取 标记 。 这 个 版 
本 的 draw_lines( ) 函数 使 用 一 个 小 的 辅助 函数 draw_mark( ) , 完成 在 给 定点 实际 输出 一 个 字符 : 


void draw_mark(Point xy char c) 


{ 
static const int dx = 4; 
static const int dy = 4; 
string m(1,c); 
fi_draw(m.c_str(),xy.x—dx,xy.y+dy); 
} 


其 中 , 常量 dx 和 dy 用 来 使 字符 居中 显示 , 字符 串 m 被 初始 化 为 单个 字符 c。 
13. 15 Marks 


我 们 有 时 需要 显示 不 与 线 关联 的 标记 , 为 此 我 们 提供 了 Marks 类 。 例 如 , 我 们 可 以 标记 上 例 


中 用 到 的 4 个 点 : 
Marks pp("x"); 
pp.add(Point(100,100)); 
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pp.add(Point(150,200)); 
pp:add(Point(250,250)); 
pp.add(Point(300,200)); 


运行 结果 为 


Tm 7 PAT Tr 
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Marks 的 一 个 明显 用 途 是 显示 表示 离散 事件 的 数据 ， 对 这 类 应 用 ,用 线 连接 各 个 数据 点 显然 不 合 
0 一 个 例子 是 一 群 人 的 (身高 和 体重 ) 数 据 。 


Marks 实际 上 是 简单 地 将 Marked_polyline 的 线 设置 为 不 可 见 (invisible) 而 实现 的 
struct Marks : Marked_polyline { 


Marks(const string& m) :Marked._polyline(m) 
{ 


set_color(Color(Color: :invisible)); 


:Marked_polyline( m) 用 来 Marked_polyline( 作为 Marks 对 象 的 一 部 分 ) 。 这 种 语法 是 成 员 初 始 化 语 
的 一 个 变形 (参见 9.4.4 节 ) 


13.16 Mark 


Point 只 是 Window 中 的 一 个 位 置 而 已 , 不 是 我 们 绘制 的 或 是 我 们 能 看 到 的 某 种 东西 。 若 想 标 
记 一 个 孤立 的 Point, 我 们 可 以 像 13, 2 节 那 样 使 用 一 对 线 或 者 使 用 Marks。 但 这 有 些 繁琐 ， 因此 我 


们 实现 了 Mark, 它 由 一 个 点 和 一 个 字符 构成 。 例 如 , 可 以 用 它 来 标记 13, 2 节 中 圆 的 圆心 ; 


Mark m1(Point(100,200),'x"); 
Mark m2(Point(150,200),'y"); 
Mark m3(Point(200,200),'z'); 
cl.set_color(Color: :blue); 
c2.set_color(Color: :red); 
c3.set_color(Color: :green); 


运行 结果 为 
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Mark 不 过 是 一 个 初始 化 是 立刻 给 定 起 始点 (通常 也 只 有 这 一 个 点 ) 的 Mark8: 


struct Mark : Marks { 

Mark(Point xy char c) : Marks(string(1,¢)) 

{ 

add(xy); 

} 
}} 
”string(1, c) 是 字符 串 string 类 的 一 个 构造 函数 ,初始 化 一 个 仅 包含 单个 字符 串 e 的 string 对 象 。 

Mark 的 全 部 作用 只 是 为 标记 为 单个 字符 的 、 单 个 点 的 Marks 对 象 提供 了 一 种 简化 表示 。 对 于 是 
否 值 得 花 力气 定义 这 样 一 个 类 ? 它 是 否 训 无 意义 ， 只 是 增加 了 复杂 性 和 混乱 ,还 没有 一 个 明确 、 合 
理 的 答案 。 我 们 反复 推敲 过 这 个 问题 , 最 后 还 是 认为 它 对 用 户 是 有 用 的 , 而 实现 它 的 代价 很 小 。 

我 们 为 什么 使 用 字符 作为 “标记 ”? 我 们 本 可 以 使 用 任何 小 形状 , 但 字符 集合 简单 丰富 , 很 适 
合作 为 标记 。 能 使 用 大 量 不 同 “ 标 记 ” 来 区 分 不 同 点 通常 是 很 有 用 的 。 另 外 , 像 x、o、+ 和 * 等 字 
符 都 具有 中 心 对 称 性 。 


13. 17 Image 


平均 每 台 PC 机 保存 着 数 千 个 图 像 文件 , 而 在 网 络 上 能 找到 的 图 像 则 数 以 百 万 计 。 很 自然 地 ， 
我 们 希望 即使 是 在 很 简单 的 程序 中 也 能 显示 这 些 图 像 。 例 如 , 下 图 (rita_path. gift) 是 飓风 丽 塔 到 达 
得 克 萨 斯 州 墨西哥 湾 的 路 线 图 : 
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Image rita(Point(0,0), "rita.jpg"); 
Image path(Point(0,0),"rita_path.gif"); 
path,set_mask(Point(50,250),600,400); select likely landfall 


win.attach(path); 
win.attach(rita); 


set_mask( ) 函数 选择 要 显示 图 像 的 某 个 子 图 像 。 在 本 例 中 , 它 从 rita_path, gif( 载 人 到 变量 path) 选 
择 一 个 600 x400 像素 大 小 的 图 像 , 其 左上 角 在 path 中 的 坐标 为 (50, 250)。 这 种 操作 十 分 常见 ， 
所 以 我 们 实现 了 set_mask 来 直接 支持 它 。 

形状 是 按照 它们 添加 的 顺序 确定 层次 次 序 的 , 就 像 将 纸 放 在 桌子 上 一 样 。 由 于 path 先 于 rita 
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-添加 到 窗口 , 所 以 它 在 rita “下层”。 
图 像 编 码 方式 非常 多 , 我 们 只 处 理 最 常用 的 两 种 : JPEG 和 GIF: 


struct Suffix { 
enum Encoding { none, jpg, gif }; 
}; 


在 我 们 的 图 形 接口 库 中 , 图 像 在 内 存 中 用 Image 类 对 象 表示 : 


struct Image : Shape { 
Image(Point xy, string file_name, Suffix: :Encoding e = Suffix: :none); 
~Imagel() { delete p; } 
void draw_lines() const; 
void set_mask(Point xy int ww, int hh) 
{w=ww; h=hh; cx=xy.x; cy=xy.y; } 
private: 
intw,h;  // define “masking box” within image relative to 
/ position (cx,cy) 
int xcy; 
Flimage" p; 
Text fn; 
}; 


Image 构造 师 数 打开 指定 文件 , 然后 按 参数 或 文件 后 缀 名 指定 的 编码 格式 创建 图 像 。 若 图 像 无 法 
显示 (如 未 找到 文件 ) , 则 显示 Bad_image。Bad_image 的 定义 为 ， 


struct Bad_image : FL_Image{ 

Bad_image(int h, int w) : FLimage(h,w0){ 1) 

void draw(int x,int y int int, int, int) { draw_empty(x,y); } 
}; 


在 图 形 库 中 , 图 像 处 理 是 非常 复杂 的 。 但 我 们 的 图 形 接口 库 中 的 Image 类 的 复杂 性 主要 来 自 构造 
函数 中 的 文件 处 理 : 


// somewhat overelaborate constructor 
/ because errors related to image files can be such a pain to debug 
lImage: :Image(Point xy, string s, Suffix: :Encoding e) 
:w(0), h(0), fn(xy,”"") 
{ 
add(xy); 


if (ican_open(s)){  //can we open s? 
fn.set_label("cannot open \""+s+™\"'); 


p=new Bad_image(30,20); /the “error image” 
return; 
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if (e == Suffix: :none) e = get_encoding(s); 


switch(e) { j check if it is a known encoding 
case Suffix: :jpg: 
p= new FL_JPEC_lmage(s.c_str(0)); 
break; 
case Suffix: :gif: 
p= new Fl_GIF_Image(s.c_str()); 
break; 
default: /unsupported image encoding 
fn.set_label("unsupported file type \""+s+\""); 
p = new Bad_image(30,20); /the "error image” 
} 
} 


我 们 通过 文件 名 后 缀 来 选择 图 像 对 象 类 型 (及 _JPEG_Image 或 用 _GIF_Image)。 使 用 new 创建 
对 象 , 并 将 地 址 赋予 一 个 指针 。 这 是 一 个 与 FLTK 结构 有 关 的 实现 细节 , 这 里 不 详细 讨论 (参见 第 
17 章 对 new 操作 符 和 指针 的 讨论 ) 。 

现在 , 我 们 只 需 实 现 can_open( ) 晴 数 , 来 测试 是 否 可 以 打开 指定 的 文件 进行 读 操 作 ， 


bool can_open(const string& s) 

/check if a file named s exists and can be opened for reading 
{ 

ifstream ff(s.c_str()); 

return ff; 


} 

打开 一 个 文件 然后 再 关闭 的 方法 虽然 比较 笨拙 , 但 对 于 区 分 “不 能 打开 文件 ”错误 和 文件 中 数据 格 

式 错 误 却 很 有 效 , 也 具有 很 好 的 可 移植 性 。 

如 果 需 要 , 你 可 以 查阅 get_encodeing( ) 郴 数 。 其 功能 抽取 给 定 文件 名 的 后 级 ,并 在 已 知 后 组 

名 表 中 查找 。 后 缀 表 是 用 标准 库 map 容器 实现 的 (参见 第 18 章 ) 。 

全》 简单 练习 

. 创建 一 个 800 x 1000 大 小 的 Simple_window。 

. 将 窗口 左 侧 的 800 x 800 区 域 绘制 为 8 x8 的 网 格 ( 因此 每 个 格子 的 大 小 为 100 x 100)。 

. 将 主 对 角 线 上 的 8 个 格子 填充 为 红色 (使 用 Rectangle) 。 

. 找 一 个 200 x 200 像素 大 小 的 图 像 (JPEG 或 GIF 格式 ) , 在 网 格 中 放置 它 的 3 份 拷贝 (每 个 图 像 占 4 个 格 
子 ) 。 如 果 不 能 找到 恰好 为 200 x200 像素 大 小 的 图 像 ,， 使 用 set_mask( ) 函数 从 大 图 像 中 选择 一 个 200 x 
200 的 区 域 。 注 意 , 不 要 挡住 红色 的 格子 。 

5. 添加 一 个 100 x 100 像素 大 小 的 图 像 ， 当 点 击 “ Next "按钮 时 , 将 它 从 一 个 格子 移动 到 另 一 个 格子 。 将 wait_ 

for_button( ) 放 在 循环 中 , 并 编写 代码 为 图 像 选 择 下 一 个 格子 。 


人 》 思考 是 


. 为 什么 我 们 不 直接 使 用 商业 的 或 者 开源 的 图 形 库 ? 

. 为 了 实现 简单 的 图 形 显示 , 你 大 约 需 要 使 用 图 形 接口 库 中 多少 个 类 ? 
. 为 了 使 用 图 形 接口 库 , 需要 哪些 头 文件 ? 

， 了 哪些 类 定义 了 闭合 形状 ? 

. 为 什么 不 简单 地 使 用 Line 表示 所 有 形状 ? 

Point 的 参数 的 含义 是 什么 ? 

.Line_style 有 哪些 成 员 ? 

.Color 有 哪些 成 员 ? 

. 什么 是 RGB? 


人 


‘DD 0 -3 On 
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10. 两 条 Line 和 包含 两 条 线 的 Lines 有 什么 区 别 ? 

11. 每 种 Shape 都 有 的 属性 有 哪些 ? 

12. 由 5 个 顶点 定义 的 Close_polyline 有 和 多少 条 边 ? 

13. 如 果 你 定义 了 Shape 但 没有 添加 到 Window 中 , 你 会 看 到 什么 ? 

14. Rectangle 与 包含 4 个 Point(4 个 顶点 ) 的 Polygon 有 什么 区 别 ? 

1$. Polygon 与 Closed_polygon 有 什么 区 别 ? 

16. 填充 和 轮廓 哪个 在 更 上 层 ? 

17. 为 什么 我 们 没有 定义 一 个 Triangle 类 ( 毕竟 我 们 定义 了 Rectangle)? 

18. 在 Window 中 怎样 移动 Shape? 

19， 怎 样 为 Shape 设置 一 行文 本 的 标签 ? 

20. 能 够 为 Text 对 象 中 的 文本 串 设 置 哪些 属性 ? 

21. 什么 是 字体 ? 为 什么 要 关心 字体 ? 

22，Vector_ref 的 作用 是 什么 ? 如 何 使 用 ? 

23，Circle 和 Ellipse 的 区 别 是 什么 ? 

24. 如 果 指 定 的 文件 不 包含 图 像 ， 当 用 该 文件 显示 一 个 Image 时 会 发 生 什 么 现象 ? 
5. 如 何 显示 图 像 的 一 个 子 图 像 ? 


~ 术语 

闭合 形状 图 像 点 颜色 图 像 编 码 多 边 形 
椭圆 不 可 见 多 段 线 填充 JPEG 未 命名 对 象 
字体 线 Vector_ref 字号 线 型 ”可见 的 

GIF 开放 形状 


埃 习题 

对 每 个 “定义 类 ”的 练习 ,显示 几 个 对 象 来 验证 其 正确 性 。 

1. 定义 Arc 类 , 绘制 部 分 椭圆 。 提 示 ; 使 用 fl_arc( ) 函数 。 

2. 定义 由 4 条 线 和 4 个 圆 弧 组 成 的 Box 类 , 绘制 一 个 圆 角 矩形 。 

3. 定义 Arrow 类 , 绘制 带 有 箭头 的 线 。 

4. 定义 函数 n()、s()、.e()、w() 、center() 、ne()、se()、sw() 和 mw()。 每 个 函数 接受 一 个 Rectangle 参 

数 , 返回 一 个 Point。 它 们 定义 了 位 于 矩形 的 边 上 和 内 部 的 “连接 点 ”。 例 如 ,nw(r) 是 名 为 + 的 Rectangle 
的 西北 (左上 ) 角 。 
5, 分 别 为 Circle 和 Ellipse 定义 练习 4 给 出 的 函数 , 使 “连接 点 "位 于 图 形 轮廓 上 或 外 部 , 但 不 超出 外 接 和 矩形 
6. 编写 程序 绘制 一 个 类 似 于 12.6 节 的 类 结构 图 , 如 果 你 第 一 步 定 义 一 个 Box 类 表示 带 有 文本 标签 的 矩形 ， 
会 简化 这 个 问题 。 

7. 创建 一 个 RGB 比 色 图 表 ( 参考 www. lnetcentral. com/ rgb-color-chart. html ) 。 

8. 定义 Hexagon 类 (hexagon 为 正六 边 形 ), 构造 函数 的 参数 为 中 心 和 从 中 心 到 每 个 角 的 距离 。 

9， 用 Hexagon 铺 贴 窗口 的 一 部 分 区 域 (至 少 使 用 8 个 六 边 形 )。 

10. 定义 Regular_polygon 类 , 构造 歇 数 的 参数 为 中 心 、 边 数 ( >2) 和 从 中 心 到 每 个 角 的 距离 。 

11. 绘制 一 个 300 x200 像素 大 小 的 椭圆 , 然后 以 圆心 为 原点 , 绘制 长 度 分 别 为 400 和 300 像素 的 x 轴 
和 y 灿 。 .标记 椭圆 的 两 个 焦 已; 标记 椭圆 边 上 不 在 坐标 轴 上 的 一 个 点 ， 并 绘制 连接 焦点 到 该 点 的 
两 条 线 。 

12. 绘制 一 个 圆 , 然后 沿 国 周 移动 一 个 标记 ( 每 按 一 一 次 “Next” 按 钮 , 标记 移动 一 段 距离 ) 。 

13. 绘制 13. 10 节 的 颜色 和 矩阵 , 但 不 显示 每 种 颜色 的 边界 线 。 

14. 定义 直角 三 角形 类 , 并 使 用 8 个 不 同 颜色 的 直角 三 角形 绘制 一 个 八 边 形 。 

15. 用 一 些小 的 直角 三 角形 铺 贴 窗口 。 

16. 用 六 边 形 重 做 习题 15。 
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17， 用 一 些 不 同 颜色 的 六 边 重 做 习题 16。 
18， 定义 Poly 类 表示 多 边 形 , 并 在 构造 函数 中 判断 给 定点 是 否 真 的 构成 一 个 多 边 形 。 提 示 : 需 给 定点 作为 构 
造 函 数 的 参数 。 
19. 定义 Star 类 。 其 中 一 个 参数 为 点 的 数目 。 使 用 不 同 数量 的 点 、 不同 颜色 的 边 、 不 同 的 填充 颜色 绘制 一 些 
”” 星 形 图 。 
忆 》 附 计 
第 12 章 讲解 了 如 何 使 用 图 形 库 的 类 。 本 章 使 我 们 上 升 到 程序 员 “ 食 物 链 ” 的 更 上 一 层 : 除了 使 用 工具 以 
外 , 还 能 设计 工具 。 


第 14 章 ”设计 图 形 类 


“实用 的 , 持久 的 ,优美 的 。” 


Vitruvius 





图 形 相关 的 这 些 章节 有 两 个 目的 : 我 们 希望 为 信息 显示 提供 有 用 的 工具 , 同时 我 们 还 希望 通 
过 一 系列 图 形 接口 类 来 说 明 一 般 的 设计 与 实现 技术 。 特 别 地 , 本章 介绍 接口 设计 的 思想 和 继承 的 
概念 。 为 此 , 我 们 不 得 不 先 介 绍 一 些 和 面向 对 和 象 程序 设计 直接 相关 的 语言 特性 : 类 派生 、 虚 孙 数 
和 访问 控制 。 我 们 不 认为 能 孤立 于 使 用 和 实现 来 讨论 设计 , 所 以 我 们 关于 图 形 类 设计 的 讨论 是 相 
当 具 体 化 的 , 或 许 你 应 该 把 本 章 看 做 "图形 类 的 设计 与 实现 。 


14.1 设计 原则 


我 们 的 图 形 接口 类 的 设计 原则 是 什么 ? 首先 : 这 是 一 个 什么 类 别 的 问题 ? 什么 是 “设计 原 
则 ”? 我 们 为 什么 要 考虑 这 些 设计 原则 , 而 不 是 直接 继续 考虑 如 何 生成 图 形 这 类 重要 的 问题 呢 ? 
14. 1. 1 类 型 

图 形 是 一 个 很 好 的 应 用 领域 的 例子 。 因 此 , 我 们 所 关注 的 是 如 何 为 ( 像 我 们 一 样 的 ) 程 序 员 提 
供 一 组 基本 的 应 用 程序 概念 和 工具 ,本 章 就 给 出 了 这 样 一 个 例子 。 如 果 我 们 的 代码 以 混乱 、 不 一 
致 、 不 完整 或 其 他 不 好 的 方式 呈现 这 些 概 念 , 生成 图 形 输出 的 难度 就 会 增 大 。 和 希望 我 们 的 图 形 类 
能 够 降低 程序 员 学 习 和 使 用 的 难度 。 

我 们 的 程序 设计 理念 是 用 代码 直接 描述 应 用 领域 概念 。 这 样 ， 如 果 你 理解 应 用 领域 , 你 就 能 
理解 代码 , 反之 亦 然 。 例 如 : 

e Window 由 操作 系统 负责 管理 的 窗口 。 

es。 Line 一 一 一 条 线 ， 就 如 你 在 屏幕 上 所 见 。 

® Point 一 个 坐标 点 。 

e。 Color 一 一 颜色 , 就 如 你 在 屏幕 上 所 见 。 

se Shape 一 一 所 有 形状 的 统称 以 我 们 的 图 形 /GUI 视角 来 看 待 世界 时 。 

最 后 一 个 例子 Shape 与 其 他 例子 不 同 , 它 是 一 个 一 般 性 的 、 纯 抽象 的 概念 。 我 们 永远 无 法 在 屏幕 
上 看 到 一 个 “一 般 形状 ”; 我 们 只 能 看 到 线 、 六 边 形 这 样 的 具体 形状 。 这 一 点 已 经 反映 在 我 们 的 类 
型 定义 中 : 你 可 以 尝试 创建 一 个 Shape 变量 ， 编 译 器 将 会 阻止 你 。 

我 们 的 图 形 接口 类 构成 一 个 库 , 这 些 类 经 常 被 组 合 在 一 起 使 用 。 它 们 给 出 了 一 个 示例 ， 当 你 
定义 描述 其 他 图 形 形 状 的 类 时 , 可 以 作为 参考 。 这 些 类 也 可 以 作为 基本 组 件 , 供 你 来 构造 描述 其 
他 形状 的 复杂 的 类 。 我 们 并 不 是 仅仅 定义 了 一 些 无 关 的 类 的 集合 , 所 以 不 能 孤立 地 为 每 个 类 进行 
设计 。 这 些 类 一 起 提供 了 一 个 如 何 生 成 图 形 的 视图 , 我 们 必须 确保 这 个 视图 是 相当 优雅 和 一 致 
的 。 考 虑 到 我 们 的 库 的 规模 ,以 及 图 形 应 用 领域 的 庞大 , 我 们 显然 不 能 对 它 的 完整 性 有 什么 期 
望 。 相 反 , 我 们 的 目标 是 简洁 性 和 可 扩展 性 。 

事实 上 , 没有 类 库 能 直接 对 其 应 用 领域 的 所 有 方面 进行 建 模 。 这 不 仅 是 不 可 能 的 , 而 且 是 毫 
无 意义 的 。 考 虑 编写 一 个 用 于 显示 地 理 信息 的 库 , 你 希望 显示 植被 吗 ? 国家 、 州 或 其 他 的 行政 边 
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界 呢 ? 道路 系统 呢 ? 铁路 呢 ? 河流 呢 ? 突出 显示 社会 和 经 济 数 据 吗 ? 温度 和 齐 麻 的 季 闻 性 变化 
呢 ? 大 气 层 中 风 的 模式 呢 ? 航空 线路 呢 ? 需要 标记 学 校 的 地 点 吗 ? 快餐 店 的 地 点 呢 ? 地 方 景点 
呢 ? 对 于 一 个 全 面 的 地 理应 用 来 说 ,“ 这 些 都 要 !”" 可 能 是 一 个 很 好 的 答案 。 人 对 于 简单 的 图 形 显 
示 程 序 , 显然 不 是 。 对 于 一 个 支持 这 类 地 理应 用 的 库 来 说 , 包含 所 有 上 述 功能 可 能 是 一 个 不 错 的 
方案 。 但 是 这 样 的 库 就 全面" 了 吗 ? 它 不 太 可 能 还 涵 瘟 其 他 图 形 应 用 , 例如 徒手 绘图 、 编辑 照片 
图 像 、 科 学 计算 可 视 化 以 及 航空 器 控制 显示 等 。 

所 以 , 如 往常 一 样 , 我 们 必须 确定 对 我 们 来 说 什么 是 最 重要 的 。 对 于 图 形 库 设计 , 就 是 要 决 
定 我 们 希望 做 好 哪 种 图 形 /GUI。 试 图 做 好 所 有 事情 通常 会 走向 失败 。 好 的 库 会 从 一 个 特定 的 角 
度 直 接 、 清晰 地 建 模 其 应 用 领域 , 强调 应 用 的 某 些 方面 , 对 其 他 方面 则 不 太 关 注 。 

我 们 提供 的 类 都 是 用 于 简单 的 图 形 和 简单 的 图 形 用 户 界面 , 它们 主要 针对 那些 需要 图 形 化 输 
出 数值 计算 /科学 计算 /工程 计算 等 应 用 的 数据 的 用 户 。 你 可 以 在 这 些 类 的 基础 之 上 创建 自己 的 
类 。 如 果 这 还 不 够 , 我 们 已 经 在 实现 中 提供 了 足够 多 的 FLTK 细节 , 如果 你 需要 , 可 以 从 中 找到 
如 何 更 直接 地 使 用 它 ( 或 者 是 一 个 类 似 的 完善 的 图 形 /GUI 库 ) 的 方法 。 不 过 , 如果 你 决定 了 这 样 
一 条 路 线 , 请 首先 掌握 第 17 章 和 第 18 章 的 内 容 。 这 两 章 包括 一 些 指针 和 内 存 管理 的 相关 内 容 ， 
这 都 是 直接 使 用 大 多 数 图 形 /GUI 库 所 必需 的 。 

我 们 的 图 形 /GUI 库 的 一 个 关键 设计 决策 是 提供 大 量 的 “小 "类 和 较 少 的 操作 。 例 如 , 我 们 提 
人 性 了 Open_polyline 、Closed_polyline 、Polygon 、Rectangle 、Marked_polyline 、Marks 和 Mark, 而 不 是 带 
有 很 多 参数 和 操作 的 单一 的 类 (可 能 命名 为 “polyline” ) ， 能 通过 这 些 参数 和 操作 指定 一 个 对 象 是 
哪 一 种 多 边 形 , 甚至 可 能 将 一 种 多 边 形 变化 为 另 一 种 多 边 形 。 这 种 思路 的 极致 就 是 只 提供 一 个 
Shape 类 , 所 有 形状 都 归 为 Shape 的 一 种 情况 。 我 们 认为 使 用 很 多 小 类 能 够 更 加 直接 、 更 加 有 效 地 
建 模 我 们 的 图 形 领域 。 一 个 提供 “所 有 形状 "的 单一 类 , 不 具备 一 个 能 帮助 理解 、 调 试 以 及 提高 性 
能 的 框架 , 会 使 用 户 对 数据 和 操作 感到 混乱 。 

14.1.2 操作 

我 们 为 每 个 类 提供 了 最 少 的 操作 。 我 们 的 设计 理念 是 用 最 小 的 接口 来 实现 我 们 想 做 的 事情 。 
当 我 们 需要 更 大 的 便利 性 时 ,可 以 通过 增加 非 成 员 函 数 或 新 的 类 来 实现 。 

我 们 希望 所 有 类 的 接口 有 一 致 的 风格 。 例 如 , 在 不 同 的 类 中 ,执行 相似 操作 的 所 有 函数 有 相 
同 的 函数 名 , 接受 相同 类 型 的 参数 , 还 可 能 要 求 这 些 参数 的 顺序 也 相同 。 考 虑 设计 这 样 一 个 构造 
函数 ; 形状 需要 一 个 位 置 , 因此 构造 函数 接受 一 个 Point 作为 第 一 个 参数 ， 

Line In(Point(100,200),Point(300,400)); 


Mark mi(Point(100 200) xD)， display a single point as an “x” 
Circle c(Point(200,200),250); 


所 有 处 理 点 的 晃 数 都 使 用 Point 类 来 表示 点 , 这 看 起 来 是 很 显然 的 方式 , 但 是 很 多 类 库 都 采用 了 
多 种 风格 的 混合 。 例 如 , 想象 一 个 简单 的 画 线 函数 , 就 可 以 有 两 种 不 同 的 风格 : 


void draw_line(Point p1, Point p2); /from pl to p2 (our style) 
void draw line(int x1, int yt int x2, int y2); I from (x1,y1) to (x2,y2) 


我 们 甚至 可 以 同时 允许 这 两 种 风格 , 但 是 出 于 一 致 性 以 及 改进 类 型 检查 和 可 读 性 的 考虑 , 我 们 选 
择 第 一 种 方式 。 一 致 地 使 用 Point 类 还 会 避免 将 坐标 和 其 他 一 般 整 数 对 (如 宽度 和 高 度 ) 混 清 。 例 


draw_rectangle(Point(100,200), 300, 400); /our style 
draw_rectangle (100,200,300,400); I/ alternative 


第 一 个 调用 利用 Point、 宽 度 和 高 度 绘制 了 一 个 矩形 , 我 们 可 以 很 容易 地 推断 出 这 些 参 数 的 含 
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义 。 但 是 第 二 个 调用 呢 ? 矩形 是 由 (100, 200) 和 (300, 400) 这 两 个 点 定义 的 吗 ? 还 是 由 一 个 点 
(100, 200) 和 宽度 300 以 及 高 度 400 定义 的 呢 ? 或 者 是 完全 不 同 的 其 他 形式 (对 某 些 人 可 能 是 合 
理 的 形式 ) ? 而 一 致 地 使 用 Poirit 类 可 以 避免 这 种 混淆 。 

顺便 说 一 下 , 如 果 一 个 函数 需要 一 个 宽度 值 和 一 个 高 度 值 , 那么 实 参 总 是 按照 这 样 的 顺序 给 
出 (就 像 我 们 总 是 先 给 出 x 坐标 , 再 给 出 y 坐标 一 样 ) 。 在 这 种 微小 细节 上 保持 一 致 性 , 会 极 大 地 
方便 使 用 , 减少 运行 时 错误 。 

逻辑 上 , 等 价 的 操作 应 该 有 相同 的 名 字 。 例 如 , 对 任何 类 型 的 形状 , 所 有 添加 点 、 线 等 的 函 
数 都 叫做 add( ) ， 所 有 画 线 函 数 叫做 draw_lines( ) 。 这 种 一 致 性 能 帮助 我 们 记忆 (只 需要 记 住 更 少 
的 细节 ), 同时 在 我 们 设计 新 类 的 时 候 也 能 给 予 我 们 帮助 (“ 按 常规 进行 即 可 ”}。 有 时 候 , 这 种 一 
致 性 甚至 允许 我 们 编写 能 用 于 很 多 不 同类 型 的 代码 ,因为 这 些 类 型 上 的 操作 有 着 同样 的 模式 。 这 
种 代码 称 为 泛 型 程序 , 参见 第 19 ~21 章 。 
14. 1.3 命名 


逻辑 上 , 不 同 的 操作 应 该 有 不 同 的 名 字 。 这 看 起 来 似乎 是 很 显然 的 , 但 是 请 考虑 : 为 什么 我 
们 将 一 个 Shape“ 添加” ( attach ) 到 一 个 Window 中 , 但 却 将 一 个 Line“ 加 入 ”(add) 一 个 Shape 中 呢 ? 
两 个 操作 都 是 “将 某 物 放 到 某 物 之 中 ”, 那么 这 种 相似 性 是 不 是 应 该 反映 为 相同 的 名 字 呢 ? 不 是 ! 
这 种 相似 性 背后 隐藏 了 一 个 根本 的 不 同 点 。 考 虑 如 下 代码 : 


Open._polyline opl; 

opl.add(Point(100,100)); 
opl.add(Point(150,200)); 
opl.add(Point(250,250)); 


这 里 , 我 们 将 3 个 点 加 入 opl 中 。 在 add( ) 调 用 完成 之 后 , 形状 opl 就 不 再 关心 “我 们 的 ”点 了 , 而 
是 自己 为 每 个 点 维护 一 份 副本 。 事 实 上 , 我 们 很 少 保存 点 的 副本 一 一 我 们 将 这 个 工作 交 给 形状 。 
而 另 一 方面 , 考虑 下 面 代码 : 

win.attach(opl); 
这 里 , 我 们 建立 了 一 个 从 窗口 win 到 我 们 的 形状 opl 的 连接 ; win 不 会 为 opl 生成 一 个 备份 一 一 它 仅 
仅 是 保存 opl 的 一 个 引用 。 因 此 , 在 win 使 用 opl 期 间 , 保证 opl 可 用 是 我 们 的 责任 而 不 是 win 的 责 
任 。 也 就 是 说 , 在 win 使 用 opl 的 时 候 , 我 们 不 能 让 opl Window: 
离开 其 作用 域 。 我 们 可 以 更 新 opl, win 下 一 次 绘制 opl Pen-poy ne 
时 ， 所 做 的 更 改 就 会 显示 在 屏幕 上 。attach() 和 add() his0300) 
的 区 别 如 右 图 所 示 。 基 本 上 ，add( ) 的 参数 传递 采用 
传 值 方式 (拷贝 副本 ) 而 attach( ) 采 用 传 引用 方式 ( 共 
享 单一 对 象 ) 。 我 们 可 以 选择 将 图 形 对 象 拷贝 到 Window 中 , 但 那 将 是 一 个 完全 不 同 的 程序 设计 模 
型 ， 在 那 种 模型 中 确实 应 该 使 用 add( ) 而 不 是 attach( ) 。 但 在 当前 的 模型 中 , 我 们 只 是 将 图 形 对 
象 “添加 ”到 Window 中 。 这 种 模型 有 一 些 重要 的 暗示。 例如 , 我 们 不 能 这 样 做 : 建立 一 个 对 象 ， 
将 其 添加 到 窗口 中 , 接着 将 对 象 销毁 ,然后 还 希望 程序 能 继续 正常 工作 : 


void f(Simple_window& w) 





Rectangle r(Point(100,200),50,30); 
w.attach(r); 
} /oops, the lifetime of r ends here 


int main() 
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Simple_window win(Point(100,100),600,400,"My window"); 
/ee 
f(win); //asking for trouble 
I... 
win.wait_for_button(); 
} 


当 我 们 已 经 退出 f( ) 函数 , 运行 到 wait_for_button( ) 的 时 候 ，win 所 引用 和 显示 的 对 象 已 经 不 存 
在 了 。 在 第 17 章 中 , 我 们 将 展示 如 何 使 函数 内 创建 的 对 象 在 函数 返回 后 还 继续 存在 。 但 现在 , 我 
们 还 是 要 避免 将 那些 生命 期 在 wait_for_button( ) 之 前 就 结束 的 对 象 添加 到 窗 口 。Vector_ref( 参见 
13. 10 节 和 附录 E.4) 可 以 帮助 我 们 解决 这 个 问题 。 

注意 , 如果 我 们 将 f( ) 的 Window 参数 声明 为 const 引用 类 型 (如 8.5.6 节 推 荐 的 那样) 编译 
器 会 阻止 我 们 犯 这 类 错误 :; 我 们 不 能 attach(r) 到 一 个 const Window, 因为 attach( ) 需要 修改 Win- 
dow 对 象 ， 以 便 记 录 r。 
14. 1.4 可 变性 

当 设 计 一 个 类 时 ,“ 谁 可 以 修改 其 数据 (描述 )?” 以 及 “ 如何 修 改 ?” 是 我 们 必须 回答 的 关键 问 
题 。 我 们 试图 保证 只 有 类 自身 能 够 修改 其 对 象 的 状态 。public/private 间 的 区 别 是 实现 这 一 效果 的 
关键 , 但 我 们 将 给 出 使 用 更 加 灵活 /微妙 的 机 制 (protected ) 的 例子 。 这 意味 着 我 们 不 仅仅 是 为 类 
提供 一 个 数据 成 员 ， 比 如 一 个 名 为 label 的 string 对 象 ; 我 们 还 必须 考虑 在 构造 之 后 是 否 允 许 修改 
它 , 以 及 如 果 允 许 的 话 ， 如何 修 改 。 我 们 还 必须 决定 非 成 员 函 数 是 否 需 要 读 取 label 的 值 , 以 及 如 
果 需 要 的 话 ， 如何 读 取 。 例 如 : 

struct Circle { 

/Se 
Pprivate: 


intr; /radius 


} 


Circle c(Point(100,200),50); 
CT=~9; I OK? No — compile-time error: Circle::r is private 


正 像 你 可 能 在 第 13 章 已 经 注意 到 的 那样 ,我 们 决定 阻止 对 大 部 分 数据 成 员 的 直接 访问 。 不 
直接 暴露 数据 成 员 , 使 我 们 有 机 会 检查 那些 “ 轧 秦 ”的 数据 ， 比 如 一 个 半径 为 负数 的 Circle 对 象 。 
出 于 实现 简单 的 考虑 , 我 们 只 是 进行 了 有 限 的 检查 , 所 以 要 小 心 处 理 你 的 数据 。 我 们 决定 不 进行 
一 致 的 、 全 面 的 检查 ,一 方面 是 希望 保持 代码 的 简洁 , 另 一 方面 是 因为 用 户 ( 你 、 我 ) 提 供 的 “ 轧 
春 " 数 据 只 会 在 屏幕 上 绘制 出 乱七八糟 的 图 像 ， 而 不 会 破坏 珍贵 的 数据 。 

我 们 将 屏幕 (可 看 做 一 组 Window) 当做 一 个 纯粹 的 输出 设备 。 我 们 可 以 在 屏幕 上 显示 新 对 象 
以 及 移 除 旧 的 对 象 , 但 不 会 向 “系统 ”请 求 他 人 绘制 的 图 像 的 信息 , 我 们 能 获取 的 信息 只 来 自 自己 
创建 的 表示 图 像 的 数据 结构 。 


14.2 Shape 类 


Shape 类 是 一 个 一 般 概 念 ， 表示 可 显示 在 屏幕 上 Window 中 的 对 象 : 
。 Shape 是 一 个 概念 , 将 图 形 对 象 与 Window 抽象 关联 起 来 , 而 Window 提供 了 操作 系统 和 物 
理 屏 幕 之 间 的 联系 。 
_e Shape 是 一 个 类 , 可 以 处 理 画 线 所 用 的 颜色 和 线 型 。 为 了 实现 这 一 功能 ， Shape 中 保存 了 一 
”个 Line :style 和 一 个 Color( 用 于 线 型 和 填充 ) 。 
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e Shape 可 以 包含 一 个 Point 序列 ,以 及 绘制 这 些 点 的 基本 方法 。 
经 验 丰 富 的 设计 者 会 意识 到 , 一 个 处 理 三 方面 工作 的 类 很 可 能 会 出 现 问 题 。 但 是 , 我 们 这 里 需要 
比 一 般 解决 方案 更 简单 的 方式 , 因此 还 是 选用 了 这 种 设计 策略 。 


我 们 首先 给 出 完整 的 类 , 然后 再 讨论 它 的 实现 细节 : 


class Shape{  //deals with color and style and holds sequence of lines 
public: 
void draw() const; 1/ deal with color and draw lines 
virtual void move(int dx, int dy); // move the shape +=dx and +=dy 


void set_color(Color col); 
Color color() const; 


void set_style(Line_style sty); 
Line_style style() const; 


void set_fill_color(Color col); 
Color fill_color() const; 


Point point(int 1) const; // read-only access to points 
int number_of_points( const; 


Virtual ~Shape0{) 
protected: 
_ Shape'(); 
virtual void draw_lines() const; // draw the appropriate lines 
void add(Point p); /add p to points 
void set_point(int i, Point p); ~ /points[li]=p; 
private: 
vector<Point> points; // not used by all shapes 
Color Icolor; // color for lines and characters 
Line_style |s; 
Color fcolor; /fill color 
Shape(const Shape&); // prevent copying 


Shape& operator=(const Shape&); 
}; 


这 是 一 个 相对 复杂 的 类 , 用 以 支持 各 种 各 样 的 图 形 类 以 及 表示 屏幕 上 形状 的 一 般 概念 。 然 而 , 它 
仍然 只 有 4 个 数据 成 员 和 15 个 成 员 函 数 。 而 且 , 这 些 函 数 都 较为 简单 , 因此 我 们 可 以 将 注意 力 集 
中 在 设计 方面 。 在 本 节 的 剩余 部 分 中 , 我 们 将 逐个 研究 这 些 类 成 员 , 并 解释 它们 在 设计 中 的 
作用 。 


14. 2. 1 一 个 抽象 类 
考虑 Shape 类 的 第 一 个 构造 函数 : 


protected: 
Shape(); 

构造 函数 是 protected 的 , 这 意味 着 只 有 Shape 类 的 派生 类 可 以 直接 使 用 它 ( 使 用 :Shape 符号 ) 。 换 
句 话说 ，Shape 只 能 用 做 其 他 类 (如 Line 和 Open_polyline ) 的 基 类 。“Pprotected:“ 用 于 构造 函数 的 
目的 是 : 保证 我 们 不 直接 创建 Shape 对 象 。 例 如 : 

Shape ss; /error: cannot construct Shape 
Shape 被 设计 为 只 能 当做 一 个 基 类 。 在 这 种 情况 下 ,如 果 我 们 允许 直接 创建 Shape 对 象 , 不 会 发 生 
什么 特别 不 好 的 事情 ; 但 由 于 可 以 限制 性 使 用 , 我 们 仍然 保留 了 修改 Shape 对 象 的 权限 , 这 使 得 
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Shape 类 不 适 于 直接 使 用 。 同 样 , 通过 禁止 直接 创建 Shape 对 象 , 我 们 直接 实现 了 这 样 一 种 思想 : 
不 能 创建 /显示 一 般 性 的 形状 , 而 只 能 创建 /显示 特定 的 形状 , 例如 Circle 或 者 Closed_polyline。 仔 
细 思 考 一 下 这 一 思想 ! 一 个 形状 看 起 来 是 什么 样子 ? 唯一 合理 的 回答 是 反问 :“ 是 什么 形状 ?” 我 
们 通过 Shape 类 所 摘 述 的 形状 概念 是 一 个 抽象 的 概念 。 这 是 一 种 重要 的 、 很 常用 也 很 有 用 的 设计 


思想 ， 因 此 我 们 不 希望 在 程序 中 实践 这 一 思想 时 打折 扣 。 构 造 函 数 可 以 定义 如 下 : 
Shape::Shape() 
: Icolor(fl_color()), / defaujt color for lines and characters 
ls(0), 1/ defauit style 
fcolor(Color: :invisible) /no fill 
{ 
} 


这 是 一 个 默认 构造 函数 , 所 以 它 将 成 员 设 置 为 默认 值 。 再 次 强调 一 下 ,实现 中 使 用 的 底层 库 
FLTK 完成 了 实际 工作 。 然 而 , 这 里 对 FLTK 的 使 用 并 没有 直接 提 及 FLTIK 的 颜色 和 风格 的 概念 ， 
它们 只 是 作为 Shape、Color 和 Line_style 类 实现 的 一 部 分 。vector < Points > 的 默认 值 为 空 问 量 。 

如 果 一 个 类 只 能 被 用 做 基 类 , 它 就 是 一 个 抽象 类 。 男 一 种 更 常用 的 定义 抽象 类 的 方法 称 为 纯 
虚 吕 数 ( pure virtual function) , 参见 14. 3. 5 节 。 与 抽象 类 相对 的 是 具体 类 ， 即 可 以 创建 对 象 的 类 。 
注意 , 抽象 和 具体 是 一 对 非常 简单 的 技术 词汇 , 我 们 可 能 每 天 都 会 用 到 它们 来 表示 区 别 。 我 们 可 
能 去 商店 买 一 台 照 相机 , 但 是 不 会 只 向 售货员 要 一 台 “ 照 相机 ”。 腿 相机 是 什么 牌子 的 ?具体 是 什 
么 型 号 ? 单词 “照相 机 ”是 一 个 通称 ; 它 代表 一 个 抽象 的 概念 。 而 “ Olympus E-3” 代 表 具 体 的 一 类 
照相 机 , 而 我 们 (花费 一 大 笔 钱 ) 可 以 获得 它 的 一 个 特定 实例 : 一 个 具有 唯一 序列 号 的 特定 的 照相 
机 。 所 以 ,“ 照 相机 "更 像 一 个 抽象 类 (其 类 ),“Olympus E-3” 更 像 一 个 具体 类 (派生 类 )， 而 我 手 
中 的 真实 的 照相 机 (如 果 我 买 了 它 ) 则 更 像 是 一 个 对 象 。 

声明 “virtual ~ Shape() 站 ”定义 了 一 个 虚 析 构 函数 。 我 们 现在 还 不 会 用 到 它 , 所 以 将 在 17. 5.2 

节 进 行 介绍 , 在 那里 我 们 介绍 如 何 使 用 它 。 
14. 2.2 访问 控制 

Shape 类 将 所 有 数据 成 员 均 声 明 为 pd 


private: 
vector<Point> points; 
Color Icolor; 
Line_style ls; 
Color fcolor; 


因为 Shape 类 的 数据 成 员 被 声明 为 private， 因此 我 们 需要 为 它们 提供 访问 函数 。 访 问 函数 的 设计 
有 和 多 种 风格 , 我 们 选择 了 一 种 较为 简单 、 方 便 、 易 读 的 方式 。 如 果 有 一 个 成 员 代表 一 个 属性 X, 我 
们 可 以 提供 一 对 函数 X( ) 和 set_X( ) 分 别 用 于 该 成 员 ( 属 性 ) 的 读 和 写 。 例 如 : 


void Shape::set_color(Color col) 
{ 


lcolor = col; 
} 


Color Shape::color() const 
{ 
return lcolor; 


} 
这 种 风格 最 主要 的 不 便 之 处 在 于 不 能 将 成 员 变 量 和 读 取 函 数 设 定 为 相同 的 名 字 。 像 以 往 一 样 , 我 
们 将 最 方便 的 名 字 赋 予 函数 ,因为 它们 是 公共 接口 的 一 部 分 , 而 私有 变量 的 命名 就 不 那么 重要 
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了 。 注 意 , 我 们 用 const 指出 读 取 函 数 不 能 修改 Shape 对 象 (人 参见 9.7:4 节 )。 
Shape 类 保存 一 个 名 为 points 的 Point 向 量 , Shape 负责 它 的 维护 ， 用 来 支持 其 派生 类 。 我 们 提 


供 了 将 Point 对 象 添加 到 points 中 的 函数 add( ) : 
void Shape::add(Point p) I protected 
{ 


points.push_back(p); 


points 初始 时 当然 应 该 是 空 的 。 我 们 决定 为 Shape 提供 一 个 完整 的 功能 接口 , 而 不 是 让 用 户 ( 即 使 
是 Shape 的 派生 类 的 成 员 函 数 ) 直接 访问 数据 成 员 。 对 于 某 些 人 来 说 , 提供 功能 接口 是 非常 正常 
的 , 因为 他 们 觉得 将 类 的 成 员 设计 为 公有 (public) 是 不 好 的 设计 。 而 对 于 另 一 些 人 , 我 们 的 设计 
看 起 来 过 于 严格 了 ， 因 为 我 们 甚至 不 允许 派生 类 的 成 员 函 数 直接 对 数据 成 员 进 行 访问 。 

一 个 派生 自 Shape 的 形状 ,比如 .Circle 和 Polygon, 是 了 解 点 (points) 的 含义 的 。 基 类 Shape 则 
并 不 “理解 ”这 些 点 , 它 只 是 存储 它们 。 因 此 ,派生 类 需要 控制 如 何 添 加 点 。 例 如 : 

。 Circle 和 Rectangle 不 允许 用 户 添 加 点 ; 因为 添加 点 没有 任何 意义 。 一 个 矩形 加 一 个 额外 的 

点 又 是 什么 呢 ( 参 见 12.7.6 节 )? 
se Lines 只 人 允许 添加 成 对 的 点 ( 而 不 是 一 个 单独 的 点 ; 参见 13.3 节 ) 。 
ve ”Open_jpolyline 和 Marks 允许 添加 任意 多 个 点 。 

e Polygon 只 允许 通过 具有 相交 性 检查 功能 的 add( ) 函数 来 添加 点 (参见 13. 8 节 )。 
我 们 将 add() 设计 为 protected( 即 只 能 从 派生 类 进行 访问 ), 保证 由 派生 类 来 控制 如 何 添加 这 些 
点 。 如 果 add( ) 函数 为 .public( 任何 人 都 可 以 添加 点 ) 或 者 private( 只 有 Shape 可 以 添加 点 ) ， 就 会 
使 得 实际 功能 无 法 符合 我 们 对 形状 的 设想 。 

同样 , 我 们 将 set_point( ) 设计 为 protected ， 即 只 有 派生 类 能 知道 点 的 含义 是 什么 以 及 是 否 可 
以 在 不 违反 不 变 式 的 前 提 下 修改 它 。 例 如 ,如 果 我 们 有 一 个 Regular_hexagon 类 , 定义 为 6 个 后 的 
集合 , 即使 只 改变 一 个 点 也 有 可 能 使 图 形 不 再 是 一 个 “正六 边 形 ”。 而 另 一 方面 , 如果 改变 四 边 形 
的 一 个 点 ， 其 结果 仍然 会 是 一 个 四 边 形 。 事 实 上 , 在 示例 类 和 代码 中 , 我 们 并 没有 发 现 有 对 set_ 
point( ) 晃 数 的 需求 ,因此 set_point( ) 在 这 里 只 是 为 了 保证 我 们 能 够 读 取 和 设置 Shape 的 每 个 属性 
的 设计 原则 仍旧 成 立 。 例 如 ,如果 要 实现 一 个 Mutable_rectangle 类 ， 我 们 可 以 从 Ropek 类 派生 ， 
并 且 提 供 更 改 点 的 操作 。 

我 们 将 存放 Point 的 向 量 points 设计 为 Private， 以 保护 它 不 会 被 意外 地 修改 。 为 了 能 使 它 有 
用 ， 我 们 还 需要 提供 成 员 函数 实现 对 它 的 访问 : 


void Shape: :set _point(int i i, Pointp) /not used: not necessary so far 1 
{ 和 
points[J = p 


Point Shape::point(lint i) const 


return points[i]; 


int Shape: :number_of_points() const 


return points.size0; 


在 派生 类 的 成 员 函 数 中 , 这 些 函 数 的 使 用 方法 如 下 : 
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void Lines: :draw_lines() const 
// draw lines connecting pairs of points 


{ 
for (int i=1; i<number_of_points(); i+=2) 
fl_line(point(i—1).x,point(i—1).y,point(i).x,point(i).y); 
} 


你 可 能 会 担心 那些 琐碎 的 访问 函数 。 它 们 是 不 是 很 低 效 ? 会 不 会 使 程序 变 慢 ? 会 不 会 增加 程序 的 
大 小 ? 不 会 的 , 它们 都 会 被 编译 器 以 “内 联 " (inlined ) 方式 进行 编译 。 实 际 上 , 调用 number_of_ 
points( ) 跟 直 接 调用 points. size( ) 使 用 一 样 多 的 内 存 , 执行 一 样 多 的 指令 。 
这 些 访 问 控制 的 考虑 和 决定 是 非常 重要 的 , 接近 于 最 小 版 本 的 Shape 类 可 以 定义 如 下 ， 
struct Shape { I close-to-minimal definition — too simple 一 not used 
Shape'(); 
void draw() const; I deal with color and call draw_lines 
virtual void draw_lines() const; // draw the appropriate lines 
virtual void movelint dx, int dy); // move the shape +=dx and +=dy 


vector<cPoint> points; J not used by all shapes 
Color lcolor; 


Line_style ls; 


Color fcolor; 


}; 
我 们 增加 的 12 个 成 员 函 数 和 两 行 访问 控制 说 明 ( private: 和 protected: ) 有 何 价值 呢 ? 其 基本 作用 
是 保护 类 的 描述 不 会 被 设计 者 以 不 可 预见 的 方式 更 改 , 从 而 使 我 们 能 用 更 少 的 精力 写 出 更 好 的 
类 。 这 就 是 所 谓 的 “不 变 式 ”( 参 见 9.4.3 市 )。 下 面 , 我 们 将 通过 定义 Shape 类 的 派生 类 来 说 明 这 


一 优点 。 一 个 简单 的 例子 是 Shape 类 的 早期 版 本 用 到 了 下 面 两 个 成 员 ; 
Fl_Color Icolor; 
int line_style; 


这 种 实现 方式 被 证 明 局 限 性 太 大 ( 线 型 为 int 类 型 不 能 完美 地 表示 线 宽 ， 而 也 _Color 不 能 表示 不 可 
见方 式 ), 并 且 使 得 代码 凌乱。 如 果 这 两 个 变量 是 公有 (public) 的 , 并 被 用 户 代码 所 使 用 , 那么 改 
进 接口 库 就 只 能 伴随 着 重 写 这 些 用 户 代 码 ( 因为 在 用 户 代 码 中 使 用 了 名字 line_color 和 line_style ) 。 
另外 , 访问 函数 在 符号 表示 方面 更 为 方便 。 例 如 , s. add(p) 比 s. points. push_back(p) 更 易 读 、 易 写 。 
14.2.3 绘制 形状 
我 们 现在 已 经 介绍 了 除 Shape 类 核心 之 外 的 所 有 内 容 : 


void draw!() const; I deal with color and call draw_lines 
virtual void draw_lines() const; // draw the lines appropriately 


Shape 最 基本 的 功能 是 绘制 形状 。 但 我 们 不 可 能 将 其 他 所 有 功能 、 数据 部 去 挥 , 而 又 不 对 Shape 造 
成 损害 (参见 14.4 节 ) 。 绘 制 是 Shape 的 本 职工 作 , 它 借助 FLTK 和 操作 系统 的 基本 机 制 来 完成 这 
一 工作 。 但 是 , 从 用 户 的 观点 来 看 , 它 只 是 提供 了 以 下 两 个 函数 :” | 

e draw( ) 函数 首先 应 用 线 型 和 颜色 设置 ， 然后 涡 用 draw_lines( ) 。 

es draw_lines( ) 在 屏幕 上 绘制 像素 。 
函数 draw( ) 并 没有 使 用 任何 新 奇 的 技术 ,只 是 简单 地 调用 FLTK 函数 来 设置 Shape 中 指定 的 颜色 
和 线 型 ,接着 调用 draw -ines( ) 函 数 在 屏幕 上 进行 实际 的 绘制 最 后 将 颜色 和 线 型 恢复 到 调用 之 
前 的 情况 : 


void Shape: :draw!() const 


Fl_Color oldc = f|_color(); 
I/ there is no good portable way of retrieving the current style 
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fl_color(Icolor.as_int()); // set color 
fl_line_stylells.style(),ls.widthQ)); /set style 
draw_lines(); 
fl_color(oldce); // reset color (to previous) 
fl_line_style(0);  //reset line styje to default 

} 


不 幸 的 是 ,FLTK 并 没有 提供 获得 当前 线 型 的 方法 , 所 以 线 型 只 是 设置 为 默认 值 。 这 就 是 有 些 时 
候 为 了 简单 性 和 可 移植 性 而 不 得 不 接受 的 妥协 。 我 们 认为 , 试图 在 接口 库 中 实现 这 一 功能 是 不 值 
得 的 。 

注意 , Shape :: draw( ) 函数 并 不 处 理 填充 颜色 或 者 线 的 可 见 性 , 这 些 都 由 单独 的 函数 draw_lines( ) 来 
完成 , 它 对 如 何 解释 这 些 设置 上 更 好 的 了 解 。 原 则 上 , 所 有 颜色 和 线 型 都 可 以 交 给 draw_lines( ) 函数 来 
处 理 , 但 是 重复 性 会 相当 高 。 

现在 考虑 我 们 应 该 如 何 处 理 draw_lines( ) 函数 。 如 果 你 稍微 想 一 下 , 就 会 明白 让 Shape 类 的 
一 个 函数 来 完成 多 种 不 同形 状 的 绘制 是 非常 困难 的 。 如 果 那 样 做 , 可 能 需要 在 Shape 对 象 中 保存 
每 个 形状 的 最 后 一 个 像素 。 如 果 我 们 继续 使 用 vector < Point > 模型 , 将 会 存储 非常 多 的 点 。 更 粳 
糕 的 是 ,“ 屏 幕 ”( 即 图 形 硬 件 ) 已 经 做 了 这 些 , 而 且 做 得 更 好 。 

为 了 避免 额外 的 工作 和 存储 空间 ，Shape 类 采用 了 另外 一 种 方式 : 它 为 每 种 Shape( 即 每 个 
Shape 的 派生 类 ) 都 提供 了 定义 自己 的 绘制 阻 数 的 机 会 。Text、Rectangle 或 Circle 类 都 可 能 有 适合 
自己 的 更 好 的 绘制 方法 。 事 实 上 ,大 部 分 形状 类 都 是 这 样 。 毕 竟 , 这 些 类 确切 地 “知道 ”它们 所 要 
绘制 的 内 容 。 例 如 , 将 Circle 类 定义 为 一 个 点 和 一 个 半径 , 远 好 于 许多 线段 。 在 需要 的 时 候 , 通 
过 一 个 点 和 一 个 半径 生成 要 绘制 的 像素 实际 上 并 不 像 想象 的 那么 困难 。 因 此 Circle 类 定义 了 自己 
的 draw_lines( ) 函数 ,我 们 更 希望 调用 这 个 防 数 而 不 是 Shape 类 的 draw_lines( ) 郴 数 。 这 就 是 将 


Shape :: draw_lines( ) 声明 为 virtual 的 意义 所 在 : 
struct Shape { 
1... 


virtual void draw_lines() const; // let each derived class define its 


/own draw_lines{} if it so chooses 
// . .， 
}; 


struct Circle : Shape { 
/1/... 
void draw lines() const;  // “override” Shape::draw_lines() 
/二 是 

}; 


所 以 , 如 果 Shape 是 一 个 Circle 对 象 , Shape 的 draw_lines( ) 就 会 以 某 种 方式 调用 Circle 的 一 个 版 本 ; 
同样 , 如果 是 一 个 Rectangle 对 象 , 就 会 调用 Rectangle 的 一 个 版 本 。 这 正 是 draw_lines( ) 声 明 中 关键 
字 virtual 的 含义 : 如 果 一 个 派生 自 Shape 的 类 定义 了 自己 的 draw_lines( ) 哨 数 (和 Shape 类 的 draw_ 
lines( ) 函数 有 相同 的 类 型 ), 那么 此 draw_lines( ) 将 被 调用 ， 而 不 是 Shape 类 的 draw_lines( )。 第 13 
章 显示 了 这 一 机 制 是 如 何在 Text、Circle、Closed_polyline 等 类 中 起 作用 的 。 在 派生 类 中 定义 一 个 孙 
数 , 使 之 可 以 通过 基 类 提供 的 接口 进行 调用 , 这 种 技术 称 为 覆盖 (overriding) 。 

注意 , 尽管 在 Shape 类 中 处 于 核心 地 位 ，draw_lines( ) 还 是 被 定义 成 protected, 这 意味 着 它 不 
能 被 “一 般 用 户 ” 调 用 一 一 这 是 draw( ) 的 目的 而 不 是 draw_lines( ) 的 ,draw_lines( ) 只 是 作为 一 个 
“实现 细节 ”被 draw( ) 函数 以 及 Shape 的 派生 类 使 用 。 

这 样 就 完成 了 12. 2 节 中 的 显示 模型 。 驱 动 屏幕 的 系统 了 解 Window 类 ， Window 类 了 解 Shape 
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类 并 可 以 调用 它 的 draw( ) 函数 。 最 后 ，draw( ) 函数 调用 特定 形状 类 的 draw_lines( ) 唤 数 。 我 们 的 
用 户 代码 对 gui_main( ) 函数 的 调用 会 月 动 这 个 显示 引擎 , 如 下 图 所 示 : 





gui_main( ) 函数 是 什么 ? 到 目前 为 止 , 我 们 还 没有 在 代码 中 实际 看 到 过 它 。 Eo 我 们 使 用 
了 wait_for_button( ) ， 它 用 更 单纯 的 方式 调用 显示 引擎 。 
Shape 类 的 move( ) 函数 简单 地 将 保存 的 每 个 点 相对 于 当前 位 置 移动 一 个 偏 移 量 : 


void Shape: :move(int dx, int dy) // move the shape +=dx and +=dy 
| for (int i = 0; i<points.size(); ++i) { 
points[il,x+=dx; 
points[i].y+=dy; 
} | 
像 draw_lines( ) 一 样 , move( ) 也 是 虚 函 数 , 因 为 派生 类 可 能 包含 所 要 移动 的 数据 ， 而 Shape 并 不 知 
道 。 例 如 , 参考 Axis( 参见 12.7.3 贡 和 15.4 节 )。 
逻辑 上 ，move( ) 函数 对 于 Shape 类 并 不 是 必须 的 , 提供 它 只 是 为 了 方便 , 同时 也 是 为 了 提供 男 
一 个 虚 函 数 的 例子 。 只 要 形状 类 包含 了 不 在 Shape 类 中 存储 的 点 , 就 应 该 定义 自己 的 move( ) 函数 。 
14. 2.4 拷贝 和 可 变性 


Shape 类 将 拷贝 构造 函数 和 拷贝 赋值 运算 符 声 明 为 private: 


private: 
Shape(const Shape&); / prevent copying 
Shape& operator=(const Shape&); 


这 样 做 的 效果 是 只 有 Shape 的 成 员 可 以 使 用 软 认 的 拷贝 操作 来 拷贝 Shape 对 象 。 这 是 为 了 防止 意 
外 拷贝 而 经 常 使 用 的 一 种 方法 。 例 如 : 


void my_fct(const Open_polyjine& op, const Circle& c) 
A 


Open_polyline op2= op; //error: Shape’s copy constructor is private 


vector<Shape>v; 

v.push_back(c); // error: Shape’s copy constructor is Private 
Mes 
op = op2; // error: Shapes assignment is private 


} 
但 是 拷贝 在 很 多 地 方 都 非常 有 用 ! 你 只 要 看 一 下 push_back( ) 函数 ,， 没 用 拷贝 功能 , 我 们 甚至 无 
法 使 用 vector( push_back( ) 将 参数 的 一 份 拷 贝 放 在 向 量 中 )。 为 什么 防止 拷贝 会 给 程序 员 带 来 麻 
烦 呢 ?对 一 个 类 型 而 言 ， 如 果 上 默认 的 拷贝 操作 可 能 引起 麻烦 , 你 可 以 将 其 禁止 。 关 于 “麻烦 ”的 一 
个 很 好 的 例子 是 my_fet( ) , 由 于 v 中 的 元 素 “ 权 ”的 大 小 为 一 个 Shape, 所 以 我 们 不 能 将 一 个 Circle 
对 象 拷贝 到 其 中 。Circle 对 象 包含 半径 数据 而 Shape 对 象 没 有 , 所 以 sizeof( Shape) < sizeof ( Cir- 
cle) 。 如 果 人 允许 执行 v. push_back(c) , 则 这 个 Circle 对 象 将 被 “切断 " 存 人 v 的 Shape 元 素 中 , 之 后 
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任何 对 此 Shape 元 素 的 使 用 都 可 能 会 引起 崩溃 ,因为 对 Circle 的 它 包 含 一 个 表示 半径 
的 成 员 (r) , 而 它 并 没有 拷贝 过 来 ,如 右 图 所 示 。op2 的 shape 于 末 Circle: [po 
拷贝 构造 函数 和 向 op 的 赋值 操作 也 面临 着 完全 一 样 的 问 ， 


题 。 考 虑 如 下 情况 : 
Marked_polyline mp(''x"); 
Circie c(p,10); 
my_fct(mp,c); //the Open_polyline argument refers to a ee 


现在 Open_polyline 的 拷贝 操作 会 将 对 象 mp 的 string 成 员 mark“ 切 断 ”。 

基本 上 , 类 层次 结合 参数 引用 传递 方式 与 默认 拷贝 是 不 能 混合 的 。 当 你 设计 一 个 将 要 作为 基 
类 的 类 时 , 应 禁用 它 的 拷贝 构造 函数 和 拷贝 赋值 操作 , 就 像 我 们 对 Shape 所 做 的 那样 。 

切断 (是 的 , 这 确实 是 一 个 技术 术语 ) 并 不 是 我 们 禁止 拷贝 的 唯一 原因 。 如 果 没 有 拷贝 操作 ， 
则 很 多 思想 可 以 更 好 地 实现 。 回 忆 一 下 , 图 形 系统 不 得 不 记 住 Shape 对 象 的 存储 位 置 ,以 便 将 它 
显示 在 屏幕 上 。 这 就 是 为 什么 我 们 要 将 Shape“ 添加 ”( attach ) 而 不 是 拷贝 到 Window。 例 如 ,如果 
窗口 只 保存 了 Shape 的 一 个 副本 , 而 不 是 引用 , 那么 , 对 原 Shape 对 象 的 任何 修改 都 不 会 影响 到 副 
本 。 那 么 , 如 果 我 们 改变 形状 的 颜色 , 窗口 将 不 会 知道 这 个 变化 , 仍 会 用 原来 的 颜色 来 显示 副本 。 
因此 , 拷贝 一 个 副本 在 实际 中 并 不 如 使 用 原始 版 本 好 。 

如 果 我 们 希望 拷贝 不 同类 型 的 对 象 ， 而 默认 拷贝 操作 被 禁用 了 ， 可 以 实现 一 个 显 式 函 数 来 完 
成 这 个 工作 。 这 种 拷贝 函数 通常 称 为 clone( ) 。 很 显然 ,只 有 当成 员 读 取 函数 能 充分 表达 构造 副 
本 需要 什么 内 容 时 , 我们 才能 编写 出 clone( ) 函数 , 而 所 有 的 形状 类 恰好 都 是 这 种 情况 。 


14.3 基 类 和 派生 类 


“让 我 们 从 一 个 更 为 技术 性 的 角度 来 观察 基 类 和 派生 类 , 也 就 是 说 , 在 本 节 中 (只 在 本 节 ) 我 们 
将 讨论 的 焦点 从 程序 设计 、 应 用 设计 和 图 形 苇 移 到 程序 设计 语言 言 的 特性 上 来 。 当 设计 一 个 图 形 接 
口 库 时 , 我们 依赖 以 下 3 个 关键 的 语言 机 制 ; 本 四 

。 派生 (derivation) : 从 一 个 类 构造 另 一 个 类 的 方法 , 使 新 构造 的 类 可 以 替换 原来 的 类 。 例 
如 ，Circle 类 派生 自 Shape 类 , 或 者 换 句 话说 ,“Circle 是 某 种 Shape” 或 者 “Shape 是 Circle 
的 基 类 ”" 。 派 生 类 (这 里 是 Circle) 除 了 目 己 的 成 员 以 外 , 还 包括 基 类 (这 里 是 Shape) 的 所 
有 成 员 。 这 通常 称 为 继承 (inheritance) ,因为 派生 类 “继承 ”7 了 其 基 类 的 所 有 成 员 。 在 某 些 
上 下 文 环境 中 , 派生 类 称 为 子 类 (subclass) ， 而 基 类 称 为 父 类 (Superclass) 。 
e 虚 函 数 (virtual function) : 在 基 类 中 定义 一 个 函数 , 在 派生 类 中 有 一 个 类 型 和 名 称 完全 一 样 
的 函数 ， 当 用 户 调用 基 类 函数 时 ,实际 上 调用 的 是 派生 类 中 的 函数 。 例 如 ,， 当 Window 对 
Circle( 添加 到 Window 的 Shape) 调 用 draw_lines( ) 函数 时 ，Circle 类 的 draw_lines( ) 函数 得 
到 执行 , 而 不 是 Shape 类 本 身 的 draw_lines( ) 函数 。 这 通常 称 为 运行 时 多 态 (mun-time poly- 
morphism ) 、 动 态 分 派 (dynamic dispatch ) 或 运行 时 分 派 (run-time dispatch ) ， 因为 具体 调用 
哪个 函数 是 根据 运行 时 实际 使 用 的 对 象 关 型 来 确 定 的 。 
私有 和 保护 成 员 ( Private and protected member) : 我 们 保持 类 的 实现 细节 为 私有 的 ， 以 保护 
它们 不 被 直接 访问 , 简化 维护 操作 , 这 通常 称 为 封装 (encapsulation ) 。 
继承 、 运 行 时 多 态 和 封装 的 使 用 , 实际 上 就 是 面向 对 象 程序 设计 (object-oriented program- 
ming) 最 常见 的 标志 。 因 此 ,除了 其 他 的 程序 设计 风格 之 外 ， C++ 还 直接 支持 面向 对 象 程序 
设计 。 例 如 , 在 第 20 和 21 章 中 , 我 们 将 看 到 C++ 如 何 支 持 泛 型 编程 。C ++ 借 用 了 Simu- 
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1a67 人 Simula67 是 第 一 个 直接 支持 面向 对 象 程序 设计 
的 语言 (参见 第 22 章 )。 

这 里 有 很 多 技术 术语 ! 但 是 它 们 代表 什么 意思 ? 同时 它们 在 计算 机 中 实际 是 如 何 工作 的 ? 我 
们 首先 为 图 形 接口 类 末 一 个 简单 的 继承 关系 图 ; 





天 到 俐 于 








箭头 从 派生 类 指向 它 的 基 类 。 这 种 图 示 可 以 帮助 我 们 看 到 类 之 间 的 关系 ， 因 此 经 常会 出 现在 程序 
员 的 黑板 上 。 与 一 个 商业 框架 相 比 , 这 是 一 个 非常 小 的 “类 层次 ”, 仅仅 包含 16 个 类 , 而 且 只 有 
Open_polyline 类 的 后 代 才 会 有 多 于 一 层 的 情况 。 很 明显 , 虽然 代表 的 是 一 个 抽象 概念 , 我 们 永远 
不 能 直接 创建 其 对 象 , 公共 基 类 ( Shape) 仍 是 最 重要 的 一 个 类 。 
14. 3. 1 ”对象 布局 
对 象 在 内 存 中 是 如 何 布局 的 呢 ? 就 像 我 们 在 9 4. 1 节 中 所 看 到 的 ， 一 个 类 的 成 员 定 义 了 对 象 的 
布局 : 数据 成 员 在 内 存 中 一 个 接 一 个 地 存储 。 当 使 用 继承 ”shape 
时 , 派生 类 的 数据 成 员 被 简单 地 放 在 基 类 的 成 员 之 后 , 如 右 
图 所 示 。 一 个 Cirele 对 象 包含 Shape 类 的 数据 成 员 ( 毕竟， 
它 也 是 一 种 Shape), 并 且 可 以 当做 Shape 对 象 使 用 。 此 外 ， 
Circle 对 象 还 有 它 自 己 的 数据 成 员 r, 存放 在 继承 的 数据 成 员 之 后 。 
为 了 处 理 一 个 虚 函数 调用 , 我 们 需要 (并 且 必须 ) 在 Shape 对 象 中 存储 更 多 的 信息 : 当 我 们 调 
用 Shape 的 draw_lines( ) 函数 时 ,可 以 借助 这 些 信息 分 辨 出 实际 应 该 调用 哪个 函数 。 常 用 的 方法 
是 增加 一 个 函数 列表 的 地 址 , 这 个 表 通 常 称 为 vtbl( 即 “virtual table” 或 “ virtual function table”, 虚 函 
数 表 ) , 它 的 地 址 通常 称 为 vptr( 即 “virtual pointer”, 虚 指针 ) 。 我 们 将 在 第 17 ~ 18 章 中 讨论 指 
在 这 里 , 它们 的 作用 类 似 于 引用 。 对 于 vibl 和 vptr, 一 个 给 定 的 实现 可 能 使 用 不 同 的 名 字 。 将 vptr 
和 vtbl 加 入 布局 图 中 可 得 到 下 图 : : : 
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因为 draw_lines( ) 函数 是 第 一 个 虚 函 数 ， 所 以 它 已 占据 了 vtbl 中 的 第 一 个 位 置 ， 紧 接着 是 第 一 个 
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盟 数 move( ) 。 只 要 你 需要 ,一 个 类 可 以 有 任意 多 个 虚 函 数 , 其 vtbl 的 规模 则 视 需 要 而 定 ( 一 个 位 
置 对 应 一 个 虚 肾 数 ) 。 当 我 们 调用 x draw_lines( ) 的 时 候 , 编译 器 查找 x 的 vtbl 中 draw_lines( ) 的 
对 应 位 置 , 调用 找到 的 函数 。 基 本 上 , 代码 只 不 过 是 按照 图 中 箭头 寻找 对 应 的 函数 而 已 。 因 此 ， 
如 采 x 是 一 个 Circle，Circle :: draw_lines( ) 将 会 被 调用 。 如 果 x 是 另 一 个 类 型 ， 比 如 Open_polyline， 
而 它 的 vtbl 与 Shape 类 一 样 , 则 Shape :: draw_lines( ) 将 会 被 调用 。 类 似 地 , 由 于 Circle 没有 定义 它 
自己 的 move( ) 晒 数 , 所 以 如 果 x 是 一 个 Circle, 则 x. move( ) 将 调用 Shape :: move( )。 基 本 上 , 虚 
函数 调用 产生 的 目标 代码 首先 简单 地 寻找 vptr, 通过 它 找 到 对 应 的 vtbl, 然后 调用 其 中 正确 的 函 
数 。 其 代价 大 约 是 两 次 内 存 访 问 加 上 一 次 普通 函数 调用 , 既 简 单 又 快速 。 

Shape 是 一 个 抽象 类 ,所 以 我 们 不 能 实际 拥有 一 个 Shape 对 象 。 但 是 一 个 Open_polyline 对 象 
拥有 和 “平凡 形状 "一样 的 布局 ,因为 它 并 没有 增加 数据 成 员 , 也 没有 定义 虚 函 数 。 对 于 每 个 具有 
虚 函 数 的 类 ,只 有 一 个 全 局 的 vtbl, 而 不 是 每 个 对 象 都 有 自己 的 vb, 所 以 vtbl 并 不 会 明显 地 增加 
程序 目标 代码 的 大 小 。 

注意 , 在 上 面 的 布局 图 中 , 我 们 没有 画 出 任何 非 虚 函 数 。 我 们 不 需要 那样 做 , 因为 那些 函数 
的 调用 方式 没有 任何 特别 之 处 ,所 以 它们 不 会 增加 对 象 的 大 小 。 

定义 一 个 和 基 类 中 虚 函数 的 名 称 和 类 型 都 相同 的 函数 ( 比如 Circle :: : draw_lines( ) ) ， 以 使 派生 
类 的 函数 代替 基 类 中 的 版 本 被 放 和 人 vtbl 中 的 技术 称 为 覆盖 。 例 如 ，Circle :: draw_lines( ) 覆盖 了 
Shape :: :: draw_lines( ) 。 : 

我 们 为 什么 要 告诉 你 这 些 关于 vtbl 和 内 存 布局 的 内 容 呢 ? 为 了 进行 面向 对 象 程序 设计 ,你 需 
要 了 解 这 些 内容 吗 ? 实际 上 并 不 需要 , 但 很 多 人 非常 想 知道 事情 是 如 何 实现 的 (我 们 也 是 如 此 ) ， 
而 当 人 们 不 理解 事情 的 时 候 , 充 诞 的 说 法 就 会 产生 。 我 们 遇 到 过 一 些 讨厌 虚 函数 的 人 ,“ 因 为 它 
们 代价 很 高 ” 。 为 什么 ? 如 何 得 出 代价 高 的 结论 ? 和 谁 相 比 ? 什么 情况 下 这 些 代 价 会 产生 问题 ? 
我 们 解释 了 虚 函 数 的 实现 模型 后 , 你 :就 不 会 再 有 这 些 铠 惧 了 。 如 果 你 需要 一 个 虚 函 数 调 用 (在 运 
行 时 选择 被 调用 函数 ) ， 你 不 可 能 使 用 其 他 语言 特性 编写 出 速度 更 快 或 者 使 用 更 少 内 存 的 代码 。 
这 一 点 很 容易 理解 。 

14. 3.2 ”类 的 派生 和 上 庶 项 数 定义 

我 们 通过 在 类 名 后 给 出 一 个 基 关 来 指定 一 个 类 为 派生 类 ， 例如 : 

struct Circle : Shape {A . a ， 
默认 情况 下 ， ee 的 成 员 都 是 公有 的 (参见 9 3 节 )， 基 类 中 的 公有 成 员 也 会 成 为 结构 体 
的 公 有 成 员 。 另 一 种 等 价 的 定义 方式 如 下 : 

class Circle : public Shape{ public: AF. .0/3 
这 两 种 Circle 的 声明 是 完全 等 价 的 ， 至 于 孵 _ 种 方式 更 好 ， 可 能 你 :和 其 他 人 争论 很 长 时 间 也 没有 
结论 。 我 们 的 意见 是 , 不 如 把 时 间 花 在 其 他 问题 上 ,可 能 更 有 价值 。 办 

注意 不 要 忘记 了 public 关键 字 。 例 如 : 

class Circle : Shape { public: /* ...*/}; //probably a mistake 
这 将 使 Shape 成 为 Circle 的 一 个 私有 基 类 ，Cirele 将 不 能 访问 Shape 的 公有 函数 。 这 很 可 能 不 是 你 
想 要 的 , 一 个 好 的 编译 器 会 给 出 警告 , 提示 这 可 能 是 个 错误 。 当 然 也 有 私有 基 类 正确 使 用 的 例 
子 , 不 过 那 不 在 本 书 讨论 范 围 之 内 。 

一 个 虚 函 数 必须 在 类 的 声明 中 被 声明 为 virtual , 但 人 关键 字 vir- 
tual 就 不 必 也 不 能 出 现在 那里 了 。 例如 : 
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struct Shape { 
fl... 
virtual void draw_lines0 const; 
Virtual void move(0); 
wa | 

上 

Virtual void Shape::draw _lines() const {/*...°/} /error 

void Shape::move() {/* ...*/} WOK 

14. 3.3 覆盖 

当 你 希望 覆盖 一 个 虚 函 数 时 ,必须 使 用 与 基 类 中 完全 相同 的 名 字 和 类 型 。 例 如 

struct Circle : Shape { 
void draw_lines(inb const; 人 probably a mistake (int argument?) 
void drawlines() const; I/ probably a mistake (misspelled name?) 
void draw_lines(); I/ probably a mistake (const missing?) 
ss 


}; 
这 里 , 编译 器 会 看 到 3 个 与 Shape :: draw_lines( ) 无 关 的 函数 (因为 它们 有 不 同 的 名 字 或 者 不 同 的 
类 型 ) ,这些 肾 数 没 有 覆盖 它 。 一 个 好 的 编译 器 会 给 出 警告 , 提示 这 些 可 能 是 错误 。 你 不 能 也 不 
必 在 覆盖 明 数 中 加 入 一 些 内 容 来 保证 它 确 实 儿 盖 了 一 个 基 类 的 函数 。 

draw_lines( ) 是 一 个 真实 的 例子 , 难以 模仿 其 所 有 细节 来 学 习 覆 盖 技 术 。 因 此 , 我 们 下 面 给 出 
一 个 纯 技术 性 的 例子 来 说 明 覆 盖 : 

struct B { 

virtual void f() const { cout << "B::f "; } 


void g() const { cout << "B::g "; } I not virtual 
}; 


structD:B'{ 
void f() const { cout << "D::f "; } I overrides B::f 
void g() { cout << "D::g ";} 

}; 


struct DD :D1 
void f() {cout << "DD::f";} I doesn't override D::f (not const) 
void g() const { cout << "DD::g ";} 
这 有 段 代码 给 出 了 一 个 简单 的 类 层次 关系 , 仅仅 包含 一 个 虚 函 数 f( )。 我 们 可 以 试 着 使 用 它 。 特 别 
地 , 我 们 可 以 试 着 调用 f( ) 和 非 虚 函数 g( ) 。 除 非 要 处 理 的 对 象 的 类 型 是 B( 或 者 是 B 的 派生 类 )， 
void call(const B& b) 


//a D isa kind of B, so call() can accepta D 
//a DD isa kind of D and a D is a kind of B, so call() can accept a DD 


{ 
b.f(); 
b.g(); 

} 

int main() 

{ 
Bb; 
D d; 
DD dd; 


call(b); 
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call(d); 
call(dd); 


b.f(); 
b.g0); 


d,f(); 
d.g(); 


dd.f(); 
dd.g0; 
) A 


你 将 得 到 

B::f8::g D::fB::g D::fB::gB: :fB: :gD::f D::g DD::f DD::g 
当 你 理解 了 为 什么 是 这 样 的 输出 结果 以 后 , 你 就 会 明白 继承 和 虚 函 数 机 制 了 。 
14. 3.4 访问 


C++ 为 类 成 员 访问 提供 了 一 个 简单 的 模型 。 类 的 成 员 可 以 是 ; 
e 私有 的 (private) : 如 果 一 个 成 员 是 私有 的 , 它 的 名 字 只 能 被 其 所 属 类 的 成 员 使 用 。 
e@ 受 保护 的 (protected) : 如 果 一 个 成 员 是 受 保护 的 , 它 的 名 字 只 能 被 其 所 属 类 及 其 派生 类 的 
”成 员 使 用 。 
。 公有 的 (public) : 如 果 一 个 成 员 是 公有 的 , 它 的 名 字 可 以 被 所 有 函数 使 用 。 
这 一 模型 也 可 以 图 形 化 表示 见 右 图 。 基 类 可 以 是 私 
受 保护 的 或 公有 的 : 
。 如 果 类 DD 的 一 个 基 类 是 private 的 , 它 的 EE 
public 和 protected 成 员 的 名 字 只 能 馈 类 D | | | 站 
的 成 员 使 用 。 公交 成 网 
。 如 果 类 D 的 一 个 基 类 是 protected 的 , 它 的 
public 和 protected 成 员 的 名 字 只 能 被 类 D 
及 其 派生 类 的 成 员 使 用 。 
。 如 果 类 的 一 个 基 类 是 public 的 ， 它 的 名 字 可 以 被 所 有 函数 使 用 
这 些 定义 忽略 了 “ 友 元 ”(friend) 的 概念 和 一 些 次 要 的 细节 , 那 不 在 本 书 讨论 范围 之 内 。 如 果 你 想 
成 为 语言 专家 , 你 需要 学 习 Stroustrup 的 《The Design and Evolution of C++ 》、 《The C++ Program- 
ming Language》 和 《2003 ISO C++ 标准 》。 但 我 们 并 不 推荐 你 成 为 语言 专家 (知道 语言 定义 的 每 一 
个 微小 细节 ) , 作为 一 名 程序 员 ( 一 位 软件 开发 者 、 工 程 师 、 用 户 以 及 所 有 实际 使 用 语言 的 人 ) 乐 
趣 更 多 , 对 社会 也 更 有 价值 。 
14. 3.5 纯 虚 项 数 
一 个 抽象 类 是 一 个 只 能 作为 基 类 的 类 。 我 们 使 用 抽象 类 来 表示 那些 抽象 的 概念 ， 即 相关 实体 
共性 的 一 般 化 所 对 应 的 那些 概念 。 人 们 曾 写 过 很 厚 的 哲学 书 试图 精确 地 定义 抽象 概念 (或 抽象 或 
一 般 性 等 ) 。 无 论 其 哲学 定义 如 何 , 抽象 概念 的 思想 是 极其 有 用 的 。 例 如 ,“ 动 物 ”( 相对 于 任何 特 
定 种 类 的 动物 ) 、 设 备 驱动 程序 (相对 于 某 种 特定 设备 的 驱动 程序 ) 和 出 版 物 ( 相对 于 任何 特定 种 
类 的 书 或 杂志 ) 。 在 程序 中 , 抽象 类 通常 定义 了 一 组 相关 类 (类 层次 ) 的 接口 。 
在 14. 2. 1 节 中 , 我 们 看 到 了 如 何 通过 声明 protected 构造 函数 来 定义 一 个 抽象 类 。 下 面 是 另 
一 种 更 常用 的 方法 : 声明 一 个 或 者 多 个 必须 在 派生 类 中 被 覆盖 的 虚 函 数 。 例 如 ; 







派生 类 成 员 
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class B{ /abstract base class 

public: | 
virtual void f() =0; // pure virtual function 
virtual void g() =0; 

} 


Bb; /error:Bi is abstract : 


这 个 奇怪 的 语法 =0 指出 B: :f() 和 BB: :8() 是 。 纯 " 虚 函数 ， 即 它们 必须 在 派生 类 中 被 覆盖 。 因 为 
B 有 纯 虚 函数 ,所 以 我 们 不 能 创建 一 个 B. 的 对 象 。 履 凑 纯 虚 函 数 可 解决 这 个 "问题 ”: 


class D1 : pubiic B { 
public: 
_ void f0; 
void g(); 
}; 


D1 di; /ok 


注意 , 除非 所 有 纯 虚 函数 都 被 覆盖 了 ， 否 则 该 派生 类 也 是 抽象 的 : 


class D2 : public 8《{ 
pvublic: 

void f(); 

I no gl) 
}; 


D2 d2; ll re D2 is i abstract 

class D3 : public D2 { 

pubiic: 

void g(); 

}; 

D3 d3; /ok 
通常 , 带 有 纯 虚 函数 的 类 的 目标 是 提供 纯粹 的 接口 ， 即 它们 倾向 于 不 包含 任何 数据 成 员 ( 数 据 成 
员 在 派生 类 中 定义 )， 因 此 没 用 任何 构造 函数 (如 果 没 有 任何 数据 成 员 需 要 初始 化 , 那么 就 不 需要 
构造 范 数 ) 。 


14.4 面向 对 象 程 序 设计 的 好 处 


当 我 们 说 Circle 派生 目 Shape, 或 者 Circle 是 一 种 Shape 的 时 候 , 实际 上 获得 了 如 下 好 处 (其 中 
之 一 或 者 两 者 省 有 ): 
e 接口 继承 (interface inheritance) : 需要 Shape 对 象 参 数 (通常 作为 一 个 引用 参数 ) 的 函数 可 
以 接受 Circle 对 象 参 数 (并 且 可 以 通过 Shape 提供 的 接口 使 用 Circle) 。 
e 实现 继承 (implementation inheritance) : 当 定 义 Circle 及 其 成 员 函数 时 , 我 们 可 以 使 用 Shape 
提供 的 功能 (如 数据 成 员 和 成 员 函 数 ) 。 
一 个 不 能 提供 接口 继承 的 设计 ( 即 一 个 派生 类 的 对 象 不 能 当做 其 公有 基 类 的 对 象 使 用 ) 是 一 个 拙 
少 且 容易 出 错 的 设计 。 例 如 , 我 们 可 能 定义 一 个 以 Shape 为 公有 基 类 的 类 Never_do_this， 然 后 定 
义 函 数 覆 盖 Shape :: draw_lines( ) ， 它 不 绘制 任何 形状 ,相反 , 将 目 己 的 中 心 向 左 移动 100 个 像素 。 
这 个 “设计 ”是 有 致命 缺陷 的 , 因为 尽管 Never_do_this 提供 了 一 个 Shape 的 接口 , 但 其 实现 没有 保 
持 Shape 所 要 求 的 语义 (意义 、 行 为 )。 永 远 不 要 这 样 做 ! 
接口 继承 之 所 以 得 名 , 是 因为 其 优点 : 代码 使 用 基 类 ( “接口 ”, 这 里 是 Shape) | 口 ,而 
无 需 知道 具体 的 派生 类 (“实现 ”; 这 里 是 Shape 的 派生 类 ) 。 
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实现 继承 之 所 以 得 名 , 是 因为 其 优点 : 通过 使 用 基 类 提供 的 功能 , 简化 了 派生 类 的 实现 。 

注意 , 我 们 的 图 形 库 设 计 严 重 依赖 接口 继承 :“ 图 形 引 擎 "调用 Shape :: draw( ) , 接着 Shape :: 
draw( ) 将 调用 Shape 的 虚 天 数 draw_lines( ) 完成 实际 的 图 形 显示 工作 。 无 论 “ 图形 引擎 "还 是 实际 
Shape 类 都 不 知道 有 哪些 具体 形状 。 特 别 是 ,“ 图 形 引 警 ”(FLIK 加 上 操作 系统 的 图 形 功能 ) 是 在 
设计 图 形 类 之 前 者 干 年 就 编写 、 编 译 好 的 ! 它 根本 无 法 知道 图 形 类 的 任何 信息 。 我 们 只 是 定义 了 
特定 的 形状 并 且 将 它们 当做 Shape 对 象 添 加 到 了 Window 中 (Window :: attach( ) 接受 一 个 Shape& 
类 型 的 参数 ; 参见 附录 E. 3)。 而 且 , 由 于 Shape 类 不 知道 你 的 图 形 类 , 当 你 每 次 定义 一 个 新 的 图 
形 接口 类 时 , 不 需要 重新 编译 Shape 类 。 

换 句 话说 , 我 们 可 以 向 程序 中 加 入 新 形状 , 而 不 用 修改 已 有 的 代码 。 这 是 一 个 软件 设计 / 开 
发 /维护 的 圣杯 : 扩展 一 个 系统 而 不 用 修改 它 。 哪 些 改进 不 必修 改 已 有 类 还 是 有 一 定 限制 的 ( 例 
如 ，Shape 提供 了 非常 有 限 的 服务 ) ,同时 这 种 技术 也 不 是 对 所 有 的 程序 设计 问题 都 能 很 好 地 应 用 
(例如 , 第 17 ~19 章 定 义 的 vector, 继承 机 制 对 其 没什么 用 处 )。 然 而 无 论 如 何 , 接口 继承 是 设计 
和 实现 对 于 改进 需求 鲁 棒 性 很 强 的 系统 的 最 有 力 的 技术 之 一 。 

同样 , 实现 继承 也 能 带 来 很 多 好 处 , 但 是 世界 上 没有 万 能 灵 药 。 通 过 在 Shape 中 放 人 有 用 的 
服务 , 我 们 避免 了 在 派生 类 中 一 人 遍 又 一 遍地 进行 重复 性 工作 的 烦恼 。 这 对 现实 世界 中 的 程序 设计 
尤为 重要 。 然 而 , 它 带 来 了 一 个 额外 代价 , 任何 对 于 Shape 接口 或 者 对 于 Shape 数据 成 员 布 局 的 
更 改 都 必须 要 重新 编译 所 有 的 派生 类 及 其 用 户 代 码 。 对 于 一 个 广泛 使 用 的 库 来 说 , 这 种 重新 编译 
是 绝对 行 不 通 的 。 当 然 ， 有 一 些 方法 可 以 在 得 到 大 多 数 好 处 的 同时 避免 大 多 数 的 问题 , 参见 
14. 3.5 节 。 


3》 简单 练习 


不 幸 的 是 , 我 们 无 法 构造 一 个 能 帮助 理解 一 般 设 计 原 则 的 简单 练习 , 所 以 在 本 练习 中 我 们 把 注意 力 集 
中 在 支持 面向 对 象 程序 设计 的 语言 特性 上 。 
1. 定义 带 有 一 个 虚 函 数 f( ) 和 一 个 非 虚 函 数 f( ) 的 类 Bl。 在 Bl 内 定义 这 两 个 函数 , 使 它们 都 输出 自己 的 
名 字 ( 例 如 “Bl :: v()”)。 将 这 两 个 函数 定义 为 公有 的 。 建 立 一 个 B1 对象 并 且 调 用 每 个 隧 数 。 
. 从 Bl 类 派生 一 个 D1 类 , 并 且 履 盖 vf( ) 。 建 立 一 个 Dl 对 象 , 并 调用 ( ) 和 f()。 
. 定义 一 个 Bl 的 引用 (Bl1&) 并 且 初 始 化 为 一 个 Dl 对 象 , 并 调用 wf( ) 和 f()。 
. 为 Dl 定义 一 个 f( ) 本 数 ， 重 做 练习 1 ~3, 并 解释 其 结果 。 
. 在 Bl 中 定义 一 个 纯 虚 涌 数 pvf( ) , 重 做 练习 1 ~4, 并 解释 其 结果 。 
. 定义 一 个 派生 自 D1 的 D2 类 ,并且 在 D2 中 覆盖 pvf( )。 建 立 一 个 D2 类 的 对 象 并 且 调 用 f( )、vi()、pfv() 
函数 。 
7. 定义 带 有 一 个 纯 虚 函数 pvf( ) 的 B2 类 。 定 义 D21 类 , 包含 一 个 string 数据 成 员 和 一 个 覆盖 pvf( ) 的 成 员 本 
数 ，D21 :: pfv( ) 输 出 string 数据 成 员 的 值 。 定 义 D22 类 , 它 与 D21 类 一 样 ， 只 是 数据 成 员 为 int 类 型 。 定 
义 函 数 f( ) ,接受 一 个 B2& 参数 ,并 对 此 参数 调用 pvf( ) 函数 。 使 用 D21 对 象 和 D22 对 象 调用 fl ) 。 
他》 思考 题 
1. 什么 是 应 用 领域 ? 
2. 什么 是 理想 的 命名 ? 
3. 我 们 可 以 命名 哪些 东西 ? 
4. Shape 类 提供 了 哪些 功能 ? 
5 
6 
7 


mn 


. 如 何 区 别 抽象 类 和 非 抽 象 类 ? 
. 如何 将 类 设计 为 抽象 类 ? 
. 访问 控制 能 够 控制 什么 ? 


8. 
9; 


10. 
11. 
Iz 
13. 
14. 
15. 
. 类 中 的 哪些 成 员 可 以 被 它 的 派生 类 访问 ? 
如 何 区 别 纯 虚 一 数 和 其 他 虚 晒 数 ? 

. 为 什么 将 一 个 成 员 陋 数 设计 为 虚 王 数 ? 

. 为 什么 将 一 个 虚 函 数 设计 为 纯 虚 也 数 ? 
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私有 (private) 数据 成 员 有 什么 好 处 ? 

虚 函 数 是 什么 ? 如 何 区 别 于 一 个 非 虚 函 数 ? 
什么 是 基 类 ? 

如 何 定义 一 个 派生 类 ? 

对 象 的 布局 意味 着 什么 ? 

使 一 个 类 更 易于 测试 , 应 该 做 哪些 工作 ? 

继承 关系 图 是 什么 ? 

保护 (protected) 对 象 和 私有 (private) 对 象 有 什么 区 别 ? 


20. 覆盖 的 含义 是 什么 ? 

21. 接口 继承 和 实现 继承 有 什么 区 别 ? 

22. 什么 是 面向 对 象 程序 设计 ? 

<》 术语 . 

抽象 类 可 变性 纯 虚 随 数 访问 控制 对 象 布局 子 类 

基 类 面向 对 象 超 类 派生 类 多 态 虚 明 数 

私有 虚 了 荐 数 调 用 封装 保护 虚 晒 数 表 
公有 

a 


1. 定义 两 个 类 Smiley 和 Frowny, 它们 都 派生 自 Circle 类 , 并 且 有 两 只 眼睛 和 一 张嘴 。 接 下 来 , 分 别 从 Smiley 


nn 心 tD 


9. 


10. 


12. 


和 Frowny 类 派生 类 , 为 其 添加 一 个 适当 的 帽子 。 


.尝试 拷贝 一 个 Shape 对 象 , 会 发 生 什么 ? 

， 定义 一 个 抽象 类 并 有 尝试 定 义 一 个 该 类 型 的 对 象 , 会 发 生 什么 ? 

. 定义 一 个 类 似 于 Circle 的 Immobile_Circle 类 ,只 是 它 不 能 移动 。 

.定义 Striped_rectangle 类 , 不 采用 标准 的 填充 方式 ， 而 是 用 一 个 像素 宽 的 水 平 线 “ 填 充 "该 矩形 的 内 部 ( 比 


如 每 隔 一 个 像素 画 一 条 线 ) 。 你 可 能 需要 通过 设置 线 宽 和 线 间距 来 获得 喜 欢 的 图 案 。 


.使 用 Striped_rectangle 中 的 技术 定义 Striped_Circle 类 。 
. 使 用 Striped_rectangle 中 的 技术 定义 Striped_closed_polyline 类 (需要 一 些 算法 上 的 创新 ) 。 
.定义 Octagon 类 , 表示 正八 边 形 。 编 写 测试 程序 , 测试 它 的 所 有 成 员 函 数 (包括 你 自己 定义 的 和 继承 自 


Shape 类 的 ) 。 

定义 Croup 类 , 表示 Shape 的 容器 , 为 其 设计 适合 的 操作 , 能 恰当 处 理 类 的 不 同 成 员 。 提 示 : 使 用 Vector_ 

ref。 利 用 Group 定义 一 个 国际 跳棋 棋盘 , 棋子 可 以 在 程序 的 控制 下 移动 。 
定义 一 个 非常 像 Window 的 Pseudo_window 类 ( 尽 你 所 能 , 但 不 必 花 费 太 大 精力 ) 。 它 应 该 是 圆 角 的 , 应 
带 有 标签 和 控制 图 标 。 也 许 你 可 以 添加 一 些 假 的 “内 容 ”, 如 一 幅 图 像 。 它 不 必 做 任何 实质 性 工作 。 一 
种 可 接受 的 方法 (实际 上 我 们 建议 这 样 做 ) 是 将 其 显示 在 一 个 Simple_window 中 。 


. 定义 一 个 Binary_tree 类 , 它 派生 自 Shape 类 。 层 数 作为 一 个 参数 (levels == 0 表示 没有 节点 ，levels == 1 


表示 有 一 个 节点 ，levels ==2 表示 有 一 个 顶层 节点 和 两 个 子 节点 ,levels ==3 表示 有 一 个 顶层 节点 、 两 个 
子 节点 以 及 这 两 个 子 节 点 的 各 自 两 个 子 节 点 , 依 此 类 推 ) 。 使 用 小 圆圈 表示 一 个 节点 ,并 用 线 连 接 这 些 
节点 。 注 意 : 在 计算 机 科学 中 , 树 是 从 一 个 顶层 节点 (有 趣 且 合乎 逻辑 的 是 它 经 常 被 称 为 根 ) 向 下 生 
长 的 。 

修改 Binary_tree, 使 用 虚 函 数 来 绘制 它 的 节点 。 然 后 ,从 Binary_tree 派生 一 个 新 类 , 对 节点 使 用 一 个 不 
同 的 表示 (比如 , 一 个 三 角形 ) 来 覆盖 此 虚 函 数 。 
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13. 修改 Binary_tree, 使 其 接受 一 个 参数 (或 者 多 个 ) 来 指出 用 什么 类 型 的 线 连 接 这 些 节点 (例如 , 一 个 同 下 
箭头 或 者 一 个 红色 的 向 下 稍 头 ) 。 注 意 , 本 题 和 习题 12 是 如 何 使 用 两 种 不 同 的 方式 使 得 类 的 层次 结构 
更 加 灵活 和 有 用 的 。 

14. 为 Binary_tree 类 增加 一 个 操作 , 将 文本 添加 到 节点 上 。 你 可 能 必须 修改 Binary_tree 的 设计 来 实现 这 个 功 
能 。 选 择 一 种 方式 来 标识 节点 , 例如 , 你 可 以 用 字符 申 “lrlr" 表 示 向 下 遍历 二 叉 树 的 左右 、 右 、 左 和 右 
会 到 达 当 前 节操 (以 1 或 者 r+ 开头 都 可 与 根 节点 匹配 )。 

15. 大 多 数 类 层次 是 与 图 形 无 关 的 。 定 义 Iterator 类 , 它 包 含 一 个 返回 值 为 double * 类 型 的 纯 中 函数 next( ) 。 
基于 Iterator 类 派生 Vector_iterator 和 List_iterator 类 , 使 Vector_iterator 的 next( ) 哨 数 生成 指 同 vector 
< double > 中 下 一 个 元 素 的 指针 ， 而 List_iterator 对 于 list < double > 类 型 实现 相同 的 操作 。Vector_iterator 
对 象 通过 一 个 vector < double > 初始 化 , 对 于 next( ) 的 第 一 次 调用 应 得 到 指向 第 一 个 元 素 的 指针 (如 果 向 
量 不 为 空 的 话 ) 。 如 果 没 有 下 一 个 元 素 的 话 , next( ) 应 返回 0。 编 写 哨 数 void print( Iterator&) ， 打印 vec- 
tor < double > 和 list < double > 中 的 元 素 , 从 而 实现 测试 。 

16. 定义 Controller 类 , 它 包 含 4 个 虚 肾 数 on( ) 、off( ) 、set_level( int) 和 show( ) 。 至 少 从 Controller 派生 出 两 
个 类 , 第 一 个 派生 类 是 一 个 简单 的 测试 类 , 它 的 show( ) 函数 打印 出 这 个 类 是 设置 为 开 还 是 关 以 及 当前 
的 级 别 ; 第 二 个 派生 类 需要 以 某 种 方法 控制 一 个 Shape 对 象 的 线 的 颜色 ,“ 级 别 ” 的 确切 含义 由 你 自己 决 
定 。 试 着 找到 Controller 类 可 以 控制 的 第 三 种 “东西 ”。 

17. 在 C++ 标准 库 中 定义 的 异常 , 例如 exception 、runtime_exception 和 out_of_range( 参 匈 5.6.3 节 ) , 被 组 织 
为 一 个 类 层次 (使 用 一 个 很 有 用 的 虚 函 数 what( )， 它 返回 一 个 字符 串 来 解释 发 生 了 什么 错误 ) 。 查 找 
C++ 标准 异常 类 的 层次 结构 , 绘制 它 的 类 层次 图 。 


人 阶 言 

软件 设计 的 理想 不 是 构造 一 个 可 以 做 任何 事情 的 程序 , 而 是 构造 很 多 类 , 这 些 类 可 以 准确 反应 我 们 的 
思想 , 可 以 组 合 在 一 起 工作 ,允许 我 们 用 来 构造 漂亮 的 应 用 程序 , 并 且 具 有 最 小 的 工作 量 ( 相对 于 任务 的 复 
杂 度 而 言 ) 、 足 够 高 的 性 能 以 及 保证 产生 正确 的 结果 等 优点 。 这 样 的 程序 易于 理解 、 易 于 维护 ， 而 简单 地 将 
一 些 代 码 快速 拼凑 在 一 起 来 完成 某 个 特定 工作 则 不 可 能 具有 这 样 的 优点 。 类 、 封 装 (由 private 和 protected 支 
持 ) 、 继 承 ( 由 类 的 派生 支持 ) 和 运行 时 多 态 (由 虚 函 数 支持 ) 都 是 我 们 构建 系统 的 最 有 力 的 工具 。 
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“至 善 者 羡 之 敌 。” 


Voltaire 





如 果 是 从 事实 验 领域 , 你 需要 用 图 表示 数据 ; 如 果 是 从 事 自然 现象 的 数学 建 模 领域 , 你 需要 
用 图 表示 函数 。 本 章 将 讨论 这 类 图 形 的 基本 机 制 。 像 往常 一 样 , 我 们 将 介绍 这 些 机 制 的 使 用 方法 
以 及 它们 的 设计 理念 。 本 章 给 出 的 关键 实例 是 绘制 一 个 带 有 单 参 数 的 函数 图 , 以 及 显示 从 文件 中 
读 取 的 值 。 


15.1 介绍 


与 可 视 化 领域 的 专业 软件 相 比 , 本 章 介绍 的 工具 比较 原始 。 我 们 的 主要 目标 不 是 输出 的 美观 
性 ,而 是 理解 如 何 生成 这 样 的 图 形 输出 以 及 其 中 所 使 用 的 编程 技术 。 你 会 发 现 , 本 章 使 用 的 设计 
方法 、 编程 技术 和 基本 数学 工具 比 提出 的 图 形 工具 有 更 长 入 的 价值 。 因 此 , 请 不 要 快速 掠 过 那些 
代码 段 , 代码 比 它们 计算 和 绘制 出 来 的 形状 更 重要 。 


15.2 绘制 简单 函数 图 


让 我 们 开始 吧 。 首 先 看 一 些 例子 ， De EE 
绘制 。 特 别 地 , 请 仔细 阅读 所 使 用 的 图 形 接口 类 。 fr 和 
此 处 , 我 们 首先 绘制 了 一 条 抛物 线 、 一 条 水 平 线 和 一 
条 斜 线 , 如 右 图 所 示 。 实 际 上 , 因为 本 章 介 绍 晴 数 的 
图 形 化 , 所 以 这 条 水 平 线 并 不 仅仅 是 一 条 水 平 线 , 它 
是 我 们 将 此 函数 图 形 化 得 来 的 : 

double one(double) { return 1; } 
这 大 概 是 我 们 能 想到 的 最 简单 的 函数 : 该 函数 只 有 
一 个 参数 , 而 且 对 任何 参数 都 返回 1。 因 为 我 们 不 需 
要 用 这 个 参数 来 计算 结果 , 所 以 我 们 不 需要 为 它 命 
名 。 对 于 每 一 个 传递 给 one( ) 函数 的 参数 x, 我 们 得 到 y 的 值 都 是 1; 也 就 是 说 , 对 所 有 的 x 而 言 ， 
这 条 线 由 (x, y) == (x, 1) 定 义 。 

像 所 有 初级 的 数学 参数 一 样 ,本 例 有 些 过 于 简单 , 所 以 让 我 们 看 一 个 稍微 复杂 一 些 的 函数 : 

double slope(double x) { return x/2; } 
这 是 生成 斜 线 的 函数 。 对 每 一 个 x, 我 们 得 到 的 y 值 为 x/2。 换 旬 话 说 , (x, y) == (x, x/2)。 两 
条 线 的 交点 是 (2, 1)。 

现在 我 们 可 以 试验 一 些 更 有 趣 的 函数 , 平方 函数 似乎 是 有 规律 地 在 本 书 中 重复 出 现 ; 

double square(double x) { return x*x; } 
如 果 你 还 记得 中 学 的 几何 课程 (即使 不 记得 了 也 不 要 紧 ),， 这 个 函数 定义 了 一 个 最 低 点 在 (0, 0) 且 
以 了 轴 对 称 的 抛物 线 。 换 名 话说 ，(x, y) == (x, x*x)。 所 以 , 抛物 线 的 最 低 点 和 和 斜 线 相交 于 点 
(0, 0)。 
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下 面 是 绘制 这 三 个 函数 的 代码 : 


const int xmax = 600; // window size 
const int ymax = 400; 


const int x_orig = xmax/2; // position of (0,0) is center of window 
const int y_orig = ymaw/2; 
const Point orig(x_orig,y_orig); 


const int r_min = ~10; / range [-10:11) 
const int r_max = 11; 


const int n_poinis = 400;  //number of points used in range 


const int x_scale = 30; // scaling factors 
const int y_scale = 30; 
Simple_window win(Point(100,100),xmax,ymax "Function graphing”); 


Function s(one,r_min,r_max,orig,n_points,x_scale,y_scale); 
Function s2(slope,r_min,r_max,orig,n_points,x_scale,y_scale); 
Function s3(square,r_min,r_max,orig,n_points,x_scale,y_scale); 


win.attach(s); 
win.attach(s2); 
win.attach(s3); 
win.wait_for_button(); 


首先 , 我 们 定义 了 一 组 常量 , 这 样 就 不 必用 “ 磨 数 ”来 弄 乱 我 们 的 代码 了 。 然 后 , 我 们 创建 了 一 个 
窗口 ,定义 这 些 函 数 , 将 它们 添加 到 窗口 上 , 最 后 将 控制 权 交 给 图 形 系 统 进行 实际 的 绘制 。 
除了 三 个 Function s、s2、s3 的 定义 外 ,其 余 的 都 是 重复 性 的 和 “样板 ”代码 : 


Function s(one,r_min,r_max,orig,n_points,x_scale,y_scale); 
Function s2(slope,r_min,r_max,orig,n_points,x_scale,y_scale); 
Function s3(square,r_min,r_max,orig,n_points,x_scale,y_scale); 


每 个 Function 都 指出 了 如 何在 窗口 中 绘制 其 第 一 个 参数 村 double ee 个 
double 类 型 值 的 函数 ) , 第 二 个 和 第 三 个 参数 给 出 x ”天 半生 二 二 计 天生 天 基 和 S 
的 取 值 范围 (传递 给 需 图 形 显示 的 函数 的 参数 ) , 第 | 
四 个 参数 (此 处 是 orig) 告知 Function 原点 (0, 0) 在 | 
窗口 中 的 位 置 。 
如 果 你 认为 参数 过 多 , 容易 混淆 , 我 们 同意 。 我 
们 的 理想 方案 是 使 用 尽 可 能 少 的 参数 ， 因 为 参数 过 
多 会 造成 混淆 且 容 易 出 错 。 但 是 , 本 例 确 实 需要 这 
么 多 参数 。 我 们 将 在 后 面 (15.3 节 ) 解释 后 三 个 参 
数 。 无 论 如 何 , 我 们 先 为 图 形 添 加 标签 , 如 右 图 所 
示 。 我 们 总 是 尝试 使 图 形 能 自我 解释 。 人 们 不 会 总 是 去 阅读 图 形 周围 的 解释 文字 , 而 且 图 像 可 能 
会 被 移动 ,从 而 导致 解释 文字 “丢失 ” 。 我 们 放 在 图 片 中 的 任何 内 容 都 会 成 为 图 片 的 一 部 分 , 更 容 
易 被 读者 注意 到 。 如 果 是 合理 的 内 容 , 还 能 帮助 读者 理解 我 们 所 显示 的 图 形 。 此 处 ,我 们 简单 地 


为 每 个 图 形 添加 了 一 个 标签 。 “添加 标签 ”的 代码 使 用 了 三 个 Text 对 象 ( 人 参见 13. 11 节 ) : 
Text ts(Point(100,y_o rig—40),"one"); 
Text ts2(Point(100,y_orig+y_orig/2—20),"W/2"); 
Text ts3(Point(x_orig—100,20), "x*x"); 
win.set_label("Function graphing: label functions"); 
win.wait_ for_button(0); 
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从 现在 开始 , 我 们 将 省 略 掉 一 些 重复 的 代码 , 包括 将 形状 添加 到 窗口 、 为 窗口 添加 标签 和 等 待 用 
户 扩 击 “Next” 按 钮 等 代码 。 

但 是 , 这 样 的 图 片 仍然 是 不 可 接受 的 。 我 们 注意 到 x/2 与 x* x 相交 于 点 (0, 0), 同时 one 
与 x/2 相交 于 点 (2, 1), 但 这 些 现象 有 些 难 以 察觉 ; 我 们 需要 使 用 坐标 轴 来 清楚 地 展现 给 
读者 : 





实现 坐标 轴 的 代码 使 用 了 两 个 Axis 对 象 (参见 15. 4 节 ): 


const int xlength = xmax—40; / make the axis a bit smaller than the window 
const int ylength = ymax—40; 


Axis x(Axis: :x,Point(20,y_orig), xlength, xlength/x_scale, "one notch == 1"); 
Axis y(Axis::y,Point(x_orig, ylength+20), 
ylength, ylength/y_scale, "one notch == 1"); 


刻度 的 数量 为 xlength/x_scale, 这 样 每 个 刻度 分 别 代 
表 数 值 1、2、3 等 。 按 照 惯例 , 坐标 轴 相 交 于 点 (0， 
0) 。 如 果 你 更 愿意 ,当然 也 可 以 让 它们 分 别 沿 着 窗 
口 左 侧 和 底部 的 边缘 , 就 像 显 示 数 据 的 惯例 那样 ( 参 
见 15.6 市 )。 为 一 种 区 别 坐 标 轴 和 数据 的 方法 是 使 
用 不 同 颜 色 : 


x.set._color(Color: :red); 
y.set_color(Color: :red); 


于 是 可 得 到 右 图 。 这 是 一 个 可 以 接受 的 输出 结果 了 ， 
虽然 出 于 美观 的 原因 , 我 们 可 能 想 要 在 顶端 留 出 一 
些 空白 以 便 和 底部 和 两 边 对 称 。 将 x 轴 的 标签 放 到 更 远 的 左 侧 也 是 一 个 更 好 的 想法 。 我 们 留 下 这 
些 缺 陷 , 这 样 我 们 就 可 以 时 常 提 及 它们 一 一 总 是 会 有 很 多 美观 细节 需要 我 们 继续 完善 。 程 序 设 计 


艺术 的 一 个 重要 部 分 就 是 知道 什么 时 候 停 止 , 将 节省 出 的 时 间 用 于 更 有 意义 的 事情 上 ( 比如 学 习 
新 的 技术 或 者 睡觉 ) 。 记 住 :“ 至 善 者 善之 敌 。 


15.3 Function 类 


oT i 
jm: £ unetion rapnihe icoloid ee 





Function 图 形 接口 类 的 定义 如 下 : 
struct Function : Shape { 
// the function parameters are not stored 


Function(Fct f, double r1, double r2, Point orig, 
int count = 100, double xscale = 25, double yscale = 25); 
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Function 是 一 个 Shape， 其 构造 函数 生成 很 多 线段 并 把 它们 存储 在 Shape 中 。 这 些 线段 是 对 王 数 于 
的 值 的 近似 。 我 们 在 范围 [rl: 怠 ) 内 等 间隔 地 计算 了 count 次 ff 的 值 ; 


Function: :Function(Fct f, double r1, double r2, Point xy 
int count, double xscale, double yscale) 
// graph f(x) for x in Ir1:f2) using count line segments with (0,0) displayed at xy 
// x coordinates are scaled by xscale and y coordinates scaled by yscale 
{ 
if (r2-r1<=0) error("bad graphing range"); 
if (count <=0) error("'non-positive graphing count"); 
double dist = (r2-r1)/count; 
doubler = r1; 
for (inti = 0; i<count; ++i) { 
add(Point(xy.x+int(r*xscale),xy.y—int(f(r)*yscale))); 
r += dist; 
} 
} 


xscale 和 yscale 的 值 分 别 用 于 设 定 x 坐标 和 y 坐标 的 比例 。 我 们 需要 设置 待 显示 的 数值 的 比例 , 使 
其 能 适合 于 窗口 的 绘制 区 域 。 

注意 ，Function 对 象 并 不 存储 传递 给 它 的 构造 函数 的 值 ， 因此 , 我 们 随后 无 法 查询 函数 的 原 
点 ,以 及 使 用 不 同比 例 重新 绘制 函数 , 等 等 。 它 实现 的 功能 就 是 (在 它 的 Shape 中 ) 存储 把 并 将 目 
身 绘制 到 屏幕 上 。 如 果 我 们 需要 在 构造 之 后 还 能 改变 Function 这 种 灵活 性 , 就 必须 存储 那些 我 们 
希望 修改 的 值 (参见 习题 2) 。 


15.3.1 默认 参数 


注意 ,我们 赋予 Function 构造 限 数 参数 xscale 和 yscale 初始 值 的 方法 。 这 种 初始 化 值 称 为 默 
认 参 数 ( default argument) ，, 如果 调用 者 没有 给 出 参数 值 , 将 使 用 此 默认 值 。 例 如 : 


Function s(one, r_min, r_max,orig, n_points, x_scale, y_scale); 

Function s2(slope, r_min, r_max, orig, n_points, x_scale);  / no yscale 
Function s3(square, r_min, r_max, orig, n_points); // no xscale, no yscale 
Function s4(sqrt, r_min, r_max, orig); //no count, no xscale, no yscale 


上 面 的 代码 等 价 于 : 


Function s(one, r_min, r_max, orig, n_points, x_scale, y_scale); 
Function s2(slope, r_min, r_max,orig, n_points, x_scale, 25); 
Function s3(square, r_min, r_max, orig, n_points, 25, 25); 
Function s4(sqrt, r_min, r_max, orig, 100, 25, 25); 


另 一 种 替代 方法 是 提供 几 个 重 载 晴 数 。 我 们 可 以 定义 4 个 构造 函数 , 而 不 是 定义 一 个 有 3 个 默认 
参数 的 构造 咕 数 : 


struct Function : Shape { // alternative, not using default arguments 
Function(Fct f, doubie r1, double r2, Point orig, 
int count, double xscale, double yscale); 
// default scale of y: 
Function(Fct f, double r1, double r2, Point orig, 
int count, double xscale); 
// default scale of x and y: 
Function(Fct double r1, double r2, Point orig, int count); 
// default count and default scale of x or y: 
Function(Fct f, double r1, double r2, Point orig); 
}; 


定义 4 个 构造 函数 的 工作 量 更 多 一 些 , 同时 对 于 这 个 含有 4 个 构造 是 数 的 版 本 , 默认 参数 的 特性 仍 
然 存在 ， 只 不 过 它 隐 藏 在 构造 函数 的 定义 中 , 而 不 是 在 声明 中 显 式 地 给 出 。 软 认 人 参数 经 常 被 用 于 构 


邹 15 剖 乡 制 通 数 轿 和 数据 固 311 


造 隧 数 中 , 但 是 它 对 其 他 类 型 的 函数 也 适用 。 注 意 , 只 能 将 末尾 的 参数 定义 为 默认 人 参数。 例如: 


struct Function : Shape { 
Function(Fct f, double r1 double r2, Point orig， 
int count = 100, double xscale, double yscale); /Werror - 
}; 


如 果 一 个 参数 有 一 个 默认 参数 值 ， 那么 其 后 的 所 有 参数 都 必须 [有 一 个 点 认 参 数值 


struct Function : Shape { 
Function(Fctf double r1, double r2, Point orig ， 
int count = 100, doubie xscale=25, double yscale=25); 

}; 
有 时 候 , 选择 好 的 默认 参数 值 比较 容易 。 这 样 的 例子 包括 字符 串 的 默认 值 ( 空 字 符 串 ) 和 vector 的 
默认 值 ( 空 vector) 。 对 于 其 他 情况 (如 Function) 选 择 一 个 默认 值 却 不 是 那么 简单 ; 我 们 通过 一 些 
实验 和 一 次 失败 的 尝试 之 后 , 找到 了 现在 所 使 用 的 这 组 默认 值 。 记 住 , 你 不 是 必须 要 提供 默认 参 
数 , 而 且 如 果 你 发 现 很 难 给 出 一 个 默认 值 , 简单 地 将 它 留 给 用 户 来 指定 即 可 。 
15. 3.2 更 多 的 例子 


我 们 增加 了 一 对 本 数 : 一 个 简单 的 余下 函 数 (oos)( 它 来 自 标准 库 ) 和 一 个 用 来 说 明 如 何 组 人 
函数 的 例子 一 一 沿 着 斜率 x/2 的 倾斜 余弦 函数 : ee 


double siloping_cos(double x) { return cos(x)+slope(x); } 


结果 如 右 图 所 示 。 对 应 的 代码 为 : 
Function s4(cos,r_min,r_max,orig,400,20,20); 
s4.set_color(Color: :blue); 
Function s5(sloping_cos, r_min,r_max,orig,400,20,20); 
x.label.move(~-160,0); 
x.notches.set_color(Color: :dark_red); 


除了 增加 这 两 个 函数 外 , 我 们 还 移动 了 x 轴 的 标 
签 并 稍微 改变 了 它 的 刻度 颜色 (只 是 为 了 说 明 如 
何 实现 ) 。 让 

最 后 , 我 们 用 图 形 显 示 一 个 对 数 函 数 、 一 个 指数 函数 、 一 个 正 驼 函数 和 一 个 余弦 函数 : 


Function f1(log,0.000001,r_max,orig,200,30,30); // log() logarithm, base e 
Function f2(sin,r_min,r_max,orig,200,30,30); / sinl) 
12.set_color(Color: :blue); 

Function f3(cos,r_min,r_max,orig,200,30,30); h cos() 

Function f4(exp,r_min,r_max,orig,200,30,30); / exp() exponential e^x 


因为 log(0) 是 没有 定义 的 (数学 上 是 负 无 穷 大 ) ， 
所 以 log 的 范围 从 一 个 小 的 正 数 开始 。 得 到 的 结果 
如 右 图 所 示 。 本 例 中 我 们 用 不 同 颜 色 区 分 这 些 函 
数 而 不 是 为 它们 添加 标签 。 

cos( ) 、sin( ) 和 sqrt( ) 等 标准 数学 函数 都 是 在 
标准 库 头 文件 < cmath > 中 声明 的 。 标 准 数学 函数 
的 列表 请 参见 24. 8 节 和 附录 B. 9. 2。 








15. 4 Axis 类 


当 我 们 显示 数据 时 ， 就 需要 使 用 Axis( 例如 15.6.4 节 ) 因为 一 个 没有 比例 信息 的 图 形 常 党 
令 人 怀疑 。 一 个 Axis 由 一 条 线 、 在 这 条 线 上 的 一 系列 “刻度 ”和 一 个 文本 标签 组 成 。Axis 的 构造 
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函数 计算 坐标 线 和 (可 选 的 ) 这 条 线 上 作为 刻度 的 一 些 线 . 


struct Axis : Shape { 
enum Orientation {x,y,2); 
Axis(Orientation d, Point xy int length， 
int number_of_notches=0, string label = ""); 


void draw_lines() const; 
void move(int dx, int dy); 
void set_color(Color c); 


Text label; 
Lines notches; 


}; 
其 中 label 和 notches 对 象 定义 为 公有 的 , 便于 用 户 处 理 它们 。 例 如 , 你 可 以 为 刻度 设置 一 个 不 同 
的 颜色 或 者 使 用 move( ) 将 label 对 象 移动 到 更 适合 的 位 置 上 。Axis 给 出 了 一 个 由 铬 干 半 独 立 对 象 
组 成 的 对 象 的 例子 。 : 

Axis 的 构造 明 数 负责 放置 坐标 线 , 并 且 如 果 number_of_notches 大 于 0 的 话 , 它 还 人 负责 添加 
“刻度 ”。 

Axis: :Axis(Orientation d, Point xy, int length, int n, string lab) 


:label(Point(0,0) ,lab) 
{ 
if (length<0) error("bad axis length"); 
switch (d){ 
case Axis: :x: 
{ Shape: :add(xy); / axis line 


Shape::add(Point(xy.x+length,xy.y)); 


if (<n) { /add notches 
int dist = length/n; 
int x = xy.x+dist; 
for (inti = 0; iji<n; ++i) { 
notches.add(Point(x,xy.y),Point(x,xy.y—5)); 


x += dist; 
} 
} 
label.move(length/3,xy.y+20);  // put the label under the line 
break; 
} 
case Axis::y: 


{ Shape::add(xy); /ay axis goes up 
Shape::add(Point(xy,x,xy.y—length)); 


if (1<n) { /add notches 
int dist = length/n; 
inty = xy.y—dist; 
for (int i = 0; i<n; ++i) { 
_ notches.add(Point(xy.x,y),Point(xy,x+5,y)); 
y -= dist; 


} 


label.move(xy.x—10,xy.y—length—10);  // put the label at top 
break; 
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} 
Case Axis::z: 

error("z axis not implemented"); 
} 


} 


与 很 多 实际 的 代码 相 比 , 这 个 构造 函数 非常 简单 , 但 是 请 仔细 阅读 , 因为 它 并 不 是 十 分 简单 , 并 
且 还 阐述 了 一 些 有 用 的 技术 。 注 意 , 我 们 如 何 将 线 存储 在 Axis 的 Shape 部 分 (使 用 Shape :: add( ) ) ， 
而 将 刻度 存储 在 一 个 独立 的 对 象 (notches) 中 。 通 过 这 种 方式 , 我 们 可 以 独立 地 处 理 线 和 刻度 ; 例 
如 , 我 们 可 以 将 它们 设置 为 不 同 的 颜色 。 类 似 地 , 标签 放置 在 相对 于 坐标 轴 的 固定 位 置 上 , 但 因 
为 它 也 是 一 个 独立 的 对 象 , 我 们 总 是 可 以 将 它 移动 到 一 个 更 好 的 位 置 。 我 们 使 用 枚 举 类 型 Orien- 
tation 来 为 用 户 提供 一 个 方便 的 并 且 不 易 出 错 的 符号 。 

因为 Axis 有 三 个 部 分 , 所 以 当 我 们 希望 把 Axis 作为 一 个 整体 来 操作 的 时 候 , 必须 提供 相应 的 
函数 。 例 如 : 

void Axis: :draw lines() const 

Shape::draw_lines(); 

notches.draw(); the notches may have a different color from the line 


label.draw(); / the label may have a different color from the line 
} 


我 们 使 用 draw( ) 而 不 是 draw_lines( ) 函数 来 绘制 notches 和 label ， 这 样 我 们 可 以 使 用 它们 各 自 的 
颜色 。 线 被 存储 在 Axis :: Shape 中 , 并 且 使 用 存储 在 相同 位 置 的 颜色 。 
我 们 可 以 分 别 为 线 、 刻 度 和 标签 设置 颜色 , 但 是 从 风格 上 来 说 , 一 般 最 好 不 要 这 样 做 , 因此 
我 们 提供 了 一 个 函数 将 这 三 部 分 设置 为 相同 的 颜色 , 
void Axis::set_color(Color c) 
{ 
Shape::set_color(c); 
notches.set_color(c); 


label.set_color(c); 
} 


类 似 地 ，Axis :: move( ) 同时 移动 Axis 的 所 有 部 分 : 
void Axis::movelint dx, int dy) 


{ 
shape::moveldx,dy); 
notches.move(dx,dy); 
label.move(dx,dy); 
} 
15.5 近似 


本 节 中 我 们 给 出 图 形 化 函数 的 另 一 个 例子 : 我 们 “动态 地 展示 ”一 个 指数 函数 的 计算 过 程 。 其 
目的 是 帮助 你 获得 数学 函数 的 感性 认识 ( 如 果 你 还 没有 ), 说 明 使 用 图 形 来 显示 计算 的 方式 , 给 出 
一 些 供 你 阅读 的 代码 , 最 后 对 计算 中 的 常见 问题 给 出 警告 。 
计算 一 个 指数 函数 的 一 种 方法 是 来 计算 如 下 序列 ， 
er ==1+x+ 了 + 了 十 二 


硬 


这 个 序列 的 项 越 多 , 得 到 的 e* 的 值 就 越 精 确 ; 也 就 是 说 , 我 们 计算 的 项 越 多 , 得 到 的 结果 就 有 更 
多 的 正确 位 数 。 我 们 要 做 的 就 是 计算 这 个 序列 , 同时 每 计算 一 项 就 图 形 化 显示 其 结果 。 这 里 的 感 
叹 号 代表 其 通常 的 数学 意义 ;, 阶乘 ; 也 就 是 说 , 我 们 要 按 顺 序 图形 化 显示 如 下 函数 ; 
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exp0(x) = 0 // no terms 

exp1(x) =1 // one term 

exp2(x) = 1+X /two terms; pow(x,1)/fac(1)==x 

exp3(x) = 1+x+pow(x,2)/fac(2) 

exp4(x) = 1+x+pow(X,2)/fac(2)+pow(x,3)/fac(3) 

PE = td Aid dd 


每 个 阳 数 都 比 前 一 个 更 接近 于 。 此 处 ,pow(x，n) 是 返回 人 的 标准 库 数 。 标准 库 中 没有 阶 
乘 函 数 , 所 以 我 们 必须 自己 定义 : 


int fac(int n) 1/ factorial(n); n! 


{ 
intr = 1; 
while (n>1) { 
r*=N; 
——hn; 
} 
return r; 
} 


fac( ) 的 另 一 种 实现 方法 ,参见 习题 1。 给 定 fac( ) ， A 


double term(double x, int n) { return pow(x,n)/fac(n); } // nth term of series 


给 定 term( ) , 计算 指数 函数 的 n 项 序列 精度 就 很 简单 了 : 


double expe(doublex, intm)  //sum ofn terms for x 


double sum = 0; 
for (int i=0; i<n; ++i) sum+=term(x,i); 
return sum; 


} 
我 们 如 何 用 图 形 显示 它 呢 ? 从 程序 设计 的 角度 看 , 难点 在 于 我 们 的 图 形 类 Function, 它 使 用 的 是 
带 有 一 个 参数 的 函数 , 而 expe( ) 有 两 个 参数 。 在 C++ 中 , 到 目前 为 止 还 没有 此 问题 的 完美 解决 
方法 。 因 此 对 目前 的 情况 , 我 们 使 用 了 一 个 简单 的 并 不 完美 的 解决 方法 (参见 习题 3)。 我 们 可 以 
将 精度 n 从 参数 列表 中 拿 出 来 , 定义 一 个 变量 来 表示 它 : 


int expN_number_of_terms = 10; 


double expN(double x) 
{ 

return expe(x,expN_number_of_terms); 
} 


现在 利用 expN(x) 可 以 计算 由 expN_number_of_terms 的 值 指定 精 度 的 指数 也 数 了 。 让 我 们 使 用 它 
来 生成 一 些 图 形 。 首 先 ,我 们 提供 一 些 坐标 轴 和 “实际 "指数 函数 一 一 标准 库 函 数 exp( ) , 这样 就 
可 以 看 到 我 们 使 用 expN( ) 得 到 的 近似 值 与 真实 值 的 接近 程度 ; 


Function real_exp(exp,r_min,r_max,orig,200,x_scale,y_scale); 
real. exp.set_color(Color: :blue); 


然后 , 可 以 通过 每 次 增加 近似 值 的 项 数 n 来 循环 处 理 一 系列 近似 值 : 
for (int n = 0; n<50; ++n) { 
ostringstream ss; 
ss << "exp approximation; n==" <<n; 
win,set_labeil(ss.str().c_str()); 
exXpN_humjber_of terms =n; 
// get next approximation: 
Function e(expN,r_min,r_max,orig,200,x_scale,y_scale); 
win.attach(e); 
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win,wait_ for_button(); 
win.detach(e); 
} 


注意 , 这 个 循环 最 后 的 detach(e) 。Function 对 象 e 的 作用 域 是 在 for 循环 体内 。 因 此 每 执行 一 次 
循环 我 们 就 得 到 一 个 名 字 为 e 的 新 Function 对 象 ， 而 每 个 循环 结束 这 个 e 就 消亡 了 , 下 一 次 会 被 
新 的 e 代替 。 因 为 e 将 会 销毁 , 所 以 窗口 必须 丢弃 那个 旧 的 e。detach(e) 就 是 保证 窗口 不 会 试图 
绘制 一 个 已 经 被 销毁 的 对 象 。 

此 代码 首先 显示 一 个 窗口 ,其 中 只 显示 了 坐标 轴 和 蓝 色 的 “实际 ”指数 函数 : 
我 们 知道 exp(0) 的 值 为 1， 所 以 这 条 蓝 色 的 “实际 指数 ”与 y 轴 相 交 于 点 (0, 1)。 

如 果 你 仔细 观察 , 你 会 发 现 我 们 实际 用 一 条 黑色 的 线 在 x 轴 正 上 方 绘制 了 零 个 项 的 近似 值 
(exp0(x) ==0) 。 点 击 “ Next”, 我 们 得 到 只 使 用 一 项 的 近似 值 。 注 意 我 们 将 项 数 显示 在 窗口 标题 
栏 中 : 





这 里 的 函数 是 exp1(x) ==1, 该 近似 值 只 使 用 了 序列 中 的 一 项 。 它 准确 地 和 指数 函数 相交 于 (0, 1)， 
但 我 们 还 可 以 做 得 更 好 : z 

使 用 两 项 (1 +x), 我 们 得 到 和 y 轴 相 交 于 点 (0， 1) 的 对 角 线 。 使 用 3 项 (1 +x+pow(x, 2)/ 
fac(2) ) , 我 们 可 以 看 到 两 条 曲线 开始 汇聚 : 





使 用 10 项 可 以 得 到 更 好 的 结果 , 特别 是 对 于 大 于 -3 的 值 : 

如 果 你 不 仔细 思考 这 个 问题 的 话 , 你 可 能 会 认为 可 以 简单 地 通过 使 用 越 来 越 多 的 项 来 得 到 越 来 越 
好 的 近似 值 。 然 而 , 这 是 有 极限 的 ， 当 超过 13 项 之 后 会 发 生 一 些 奇怪 的 事情 。 首 先 , 近似 值 开始 
慢 慢 变 差 , 而 在 18 项 时 会 出 现 一 些 竖 直 线 : 
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记 住 , 浮 点 算术 并 不 是 纯粹 的 数学 运算 。 用 浮 点 数 表示 实数 ， 只 能 得 到 和 固定 位 数 一 样 的 近似 结 
果 。 问 题 在 于 我 们 的 运算 开始 产生 一 些 不 能 表示 为 double 类 型 的 值 ， 导致 结果 开始 偏离 数学 上 正 
确 的 结果 。 更 多 信息 请 参见 第 24 章 。 

最 后 这 幅 图 片 是 “看 起 来 正确 ”不 等 同 于 “通过 测试 ”这 一 原则 的 一 个 很 好 的 例子 。 在 把 程序 
交 给 他 人 使 用 之 前 一 定 要 进行 测试 , 即便 是 那些 起 初 看 似 合理 的 东西 。 除 非 你 对 程序 有 更 深 的 理 
解 , 否则 稍微 延长 运行 时 间或 者 给 出 稍微 不 同 的 输入 数据 , 就 可 能 导致 程序 陷 人 混乱 一 一 就 像 本 
例 这 样 。 


15.6 绘制 数据 图 


显示 数据 是 一 门 需要 很 高 技巧 , 具有 很 高 价值 的 技艺 。 如 果 能 做 得 很 好 , 通常 是 结合 了 技术 
和 艺术 两 个 方面 的 知识 , 能 极 大 地 促进 我 们 对 复杂 Sn pa ee a 
现象 的 理解 。 但 是 , 它 也 使 图 形 化 变 成 一 个 巨大 的 ee 
领域 , 而 且 其 大 部 分 和 程序 设计 技术 无 关 。 这 里 , 我 
们 仅仅 展示 一 个 简单 的 例子 , 它 显示 从 一 个 文件 中 
读 取 的 数据 。 这 些 数 据 给 出 了 近 一 个 世纪 以 来 日 本 
人 的 年 龄 构成 。2008 年 以 后 的 数据 是 预测 的 结果 如 
右 图 所 示 。 我们 将 使 用 这 个 例子 来 讨论 显示 这 种 数 
据 涉 及 的 程序 设计 问题 : 

。 读 取 文件 

。 调整 数据 的 比例 适合 窗口 的 大 小 

。 显示 这 些 数据 

。 给 图 形 加 上 标签 
我 们 不 会 涉及 艺术 上 的 细节 。 这 基本 上 属于 “简单 的 图 形 ”, 而 不 是 “图 形 艺 术 ”。 当 然 , 如 果 需 
要 , 你 也 可 以 做 得 更 有 艺术 性 。 

给 定 一 组 数据 , 我 们 必须 考虑 如 何 能 最 好 地 显示 它 。 为 了 简化 , 我 们 将 只 处 理 那些 方便 用 二 
维 显示 的 数据 , 不 过 这 也 正 是 大 部 分 人 需要 处 理 的 数据 中 最 大 的 一 部 分 。 注 意 , 那些 柱状 图 、 饼 
图 和 类 似 的 流行 显示 方式 , 其 实 也 都 是 用 一 种 有 趣 的 二 维 方 式 显示 的 。 三 维 数据 的 处 理 通常 也 是 
生成 一 系列 二 维 图 像 , 或 者 在 一 个 窗口 中 又 加 几 张 二 维 图 形 ( 如 “日 本 人 的 年 龄 ”的 例子 ) , 或 者 对 
单个 点 添加 信息 标签 等 。 如 果 要 超出 这 些 方法 , 我 们 就 必需 编写 新 的 图 形 类 或 者 采用 其 他 的 图 
形 库 。 

所 以 , 我 们 的 数据 是 基本 的 数值 对 , 例如 (year，number of children) 。 如 果 有 更 多 的 数据 , 例 


a 
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如 (year，number of children ，number of adults ，number of elderly) , 我 们 只 是 需要 确定 哪 一 对 或 者 哪 
几 对 数据 是 需要 绘制 的 。 在 我 们 的 例子 中 , 我 们 只 是 图 形 显示 (year, number of children) 、( year， 
number of adults) 和 (year，number of elderly) 。 

我 们 有 很 多 方式 看 待 一 组 (x, y) 数 值 对 。 当 考虑 如 何 用 图 形 显示 这 样 一 组 数据 的 时 候 ， 重 要 
的 是 要 考虑 一 个 数值 是 否 在 某 种 意义 上 是 为 一 个 数值 的 函数 。 例 如 ,对 于 一 个 (year, steel produc- 
tion) 对 , 很 明显 可 以 把 钢 产 量 作 为 年 份 的 一 个 隐 数 并 以 一 条 连续 的 线 显 示 数 据 。 可 以 用 Open_ 
polyline( 参 见 13. 6 节 ) 显 示 这 类 数据 。 如 果 y 不 应 该 被 看 做 x 的 函数 , 例如 (gross domestic product 
per person ，population of country) ,可 以 用 Marks( 参 见 13. 15 市 ) 绘制 相互 独立 的 点 。 

现在 , 回 到 日 本 人 年 龄 分 布 的 例子 。 
15. 6.1 读 取 文件 


年 龄 分 布 文件 由 很 多 行 组 成 , 例如 : 
(1960:30656) 

(1970 : 24 69 7 ) 

(1980 : 23 689) 


冒号 后 面 的 第 一 个 数字 是 儿童 (0 ~ 14 岁 ) 在 总 人 数 中 的 百分比 , 第 二 个 是 成 年 人 (15 ~64 岁 ) 的 
百分比 , 第 三 个 是 老年 人 (65 岁 以 上 ) 的 百分比 。 我 们 的 目标 就 是 读 出 这 些 数据 。 注 意 , 数据 的 格 
式 有 点 不 规则 。 与 往常 一 样 , 我 们 必须 要 处 理 这 些 细 市。 

为 了 简化 这 个 任务 , 我 们 首先 定义 一 个 保存 数据 项 的 Distribution 类 型 和 一 个 读 取 这 些 数 据 项 
的 输入 操作 符 。 


struct Distribution { 
int year, young, middle, old; 


}; 


istream& operator>>(istream& is, Distribution& d) 
1 assume format: ( year : young middle old ) 
{ 
char ch1 = 0; 
char ch2 = 0; 
char ch3 = 0; 
Distribution dd; 


if (is >> ch1 >> dd.year 
>> ch2 >> dd.young >> dd.middle >> dd.old 
>> ch3) { 
if (ch1!= °C | ch2!=":' | ch31=")') { 
is.clear(ios_base: :failbit); 
return is; 


} 


else 

return is; 
d = dd; 
return is; 


} 

这 是 第 10 章 中 的 概念 的 一 个 直接 应 用 。 如 果 你 不 熟悉 这 段 代 码 , 请 复习 第 10 章 。 我 们 不 是 必须 
要 定义 一 个 Distribution 类 型 和 一 个 >> 操作 符 。 然 而 , 与 “只 是 读 取 数字 并 用 图 形 显 示 它 们 ”的 蛮 
力 方 法 相 比 , 这 样 做 可 以 简化 代码 。 我 们 使 用 Distribution 将 代码 划分 为 有 助 于 理解 和 调试 的 几 个 
逻辑 部 分 。 不 要 觉得 引入 新 类 型 “只 是 为 了 使 代码 清晰 ”。 类 的 定义 和 使 用 能 使 代码 更 加 直接 地 
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对 应 我 们 对 概念 的 思考 。 即 使 对 那些 仅仅 在 代码 局 部 区 域 中 使 用 的 “小 ”概念 也 应 这 么 做 , 例如 一 
行 数据 表示 一 年 的 年 龄 分 布 , 这 会 很 有 帮助 。 

给 定 Distribution， 读 取 循 环 可 这 样 设计 : 

string file_name = "japanese-age-data.txt ; 


ifstream ifs(file_name.c_str0)， 
if (1ifs) error("can't open ”位 e_name); 


Wa 


Distribution d; 
while (ifs>>d) { 
if (d.year<base_year || end_year<d.year) 
error("year out of range"); 
if (d.young+d.middie+d.old != 100) 
error("percentages don't add up"); 
ys 
} 


也 就 是 说 , 我 们 试图 打开 文件 “japanese - age - data. txt”,， 如果 找 不 到 这 个 文件 就 退出 程序 。 不 将 
文件 名 “ 硬 编码 ”到 源 代码 中 会 更 好 一 些 , 但 我 们 考虑 到 这 只 是 一 个 “一 次 性 ”的 小 程序 , 所 以 没有 
采用 这 种 更 好 的 方法 , 它 适合 长 期 使 用 的 应 用 程序 , 但 会 增加 这 个 小 程序 的 负担 。 另 一 方面 , 我 
们 确实 是 把 japanese-age-data. txt 存在 一 个 命名 的 string 变量 中 ,如 果 我 们 将 此 程序 或 它 的 一 部 分 
用 做 其 他 用 途 , 程序 也 很 容易 修改 。 

读 取 循环 检查 所 读 年 份 是 否 在 预期 的 范围 内 , 同时 检查 百分比 之 和 是 否 为 100。 这 是 一 个 
基本 的 数据 检查 , 因为 >> 检查 了 每 个 单独 的 数据 项 的 格式 , 我 们 不 用 在 主 循环 中 再 做 更 多 的 
检查 。 

15. 6.2 一 般 布 局 

那么 我 们 想 在 屏幕 上 显示 什么 呢 ? 你 可 以 从 15.6 节 的 开始 看 到 答案 。 这 些 数据 看 起 来 需要 
3 个 Open_polyline, 分 别 对 应 3 个 年 龄 组 。 因 为 这 些 图 形 需要 添加 标签 , 所 以 我 们 决定 为 每 条 线 
在 窗口 的 左 侧 写 一 个 “标题 ” 。 在 这 种 情况 下 , 这 种 方式 看 起 来 比 将 标签 放 在 线 上 某 个 位 置 的 方式 
更 为 清晰 。 另 外 , 我 们 使 用 颜色 来 区 分 图 形 并 与 标签 关联 。 

我 们 想 用 年 份 来 标注 x 轴 。2008 年 处 的 那 条 竖 直 线 表明 后 面 的 图 形 是 根据 预测 数据 绘制 的 。 

我 们 决定 使 用 窗口 标签 作为 我 们 图 形 的 标题 。 

让 图 形 化 的 代码 既 正 确 又 美观 是 非常 束 手 的 。 一 个 主要 原因 是 我 们 需要 做 很 多 有 关 尺 
寸 和 偏 移 量 的 高 精度 计算 。 为 了 简化 , 我 们 开始 先 定义 一 组 符号 常量 来 表示 对 屏幕 空间 的 
使 用 方式 : 


constint xmax = 600;  //window size 
const int ymax = 400; 


const int xoffset = 100; // distance from left-hand side of window to y axis 
const int yoffset = 60; /distance from bottom of window to x axis 


const int xspace = 40; /space beyend axis 
const int yspace = 40; 


const int xlength = xmax~xoffset—xspace; // length of axes 

const int ylength = ymax~yoffset—~yspace; 
基本 上 , 这 里 定义 了 一 个 矩形 空间 (窗口 ) 及 其 内 部 的 男 一 个 矩形 (通过 坐标 轴 定 义 )， 如 下 图 
所 示 : a 
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如 果 没 有 这 样 一 个 表明 窗口 中 的 事物 位 置 的 “示意 图 ”" 和 用 于 定义 位 置 的 符号 常量 , 当 程 序 输出 不 
能 反映 所 要 求 的 结果 时 , 我 们 将 会 迷失 方向 并 且 感 到 无 助 。 
15. 6. 3 数据 比例 

接 下 来 , 需要 定义 怎样 才能 让 数据 适合 这 个 空间 。 我 们 通过 按 比 例 缩放 数据 来 达到 这 个 目 
的 , 使 数据 适合 由 坐标 轴 定 义 的 空间 。 因 此 , 我 们 需要 使 用 比例 因子 , 即 数据 范围 和 坐标 轴 范 围 
之 间 的 比值 。 


const int base_year = 1960; 
const int end_year = 2040; 


const double xscale = double(xlengthM(end year-base_year); 
const double yscale = double(ylength)/100; 


比例 因子 (xscale 和 yscale) 应 该 是 浮 点 数 一 一 否则 我 们 的 运算 将 会 面 对 严 重 的 会 人 误差 。 为 了 避 
免 整数 除法 , 在 做 除法 之 前 先 把 长 度数 据 转 换 成 double 类 型 (参见 4.3.3 节 )。 

现在 , 我 们 可 以 通过 减 去 基准 值 (1960) , 使 用 xscale 进行 比例 缩放 , 并 加 上 xoffset, 将 一 个 数据 
点 放 到 x 轴 上 。 按 同样 的 方式 可 以 处 理 y 轴 上 的 数据 。 不 过 ,， 当 试 图 重复 做 这 件 事情 的 时 候 , 我 们 
发 现 很 难 记得 非常 清楚 。 这 可 能 是 一 个 不 太 重 要 的 运算 , 但 它 是 需要 技巧 和 时 间 的 。 为 了 简化 代码 
并 减 小 出 错 的 机 会 (尽量 减少 令 人 诅 丧 的 调试 工作 ), 我 们 定义 了 一 个 很 小 的 类 来 完成 这 个 运算 。 


class Scale{ /data value to coordinate conversion 


int cbase; I coordinate base 
int vbase; I base of values 
double scale; 

public: 


Scale(int b, int vb, double s) :cbase(b), vbase(vb), scale(s) {} 
int operator()(int v) const { return cbase + (v—vbase)*scale; } 
}; 


我 们 需要 一 个 类 , 因为 这 个 运算 依赖 3 个 常量 值 , 而 我 们 又 不 愿意 总 是 不 必要 地 重复 它们 。 给 定 


这 个 类 , 我 们 可 定义 : 
Scale xs(xoffset,base_year,xscale); 
Scale ys(ymax—yoffset,0,—yscale); 


注意 , 我 们 是 如 何 使 ys 的 比例 因子 变 为 负 值 , 以 反映 y 坐标 向 下 增长 的 一 一 我 们 通常 用 图 形 上 更 
高 的 点 表示 更 大 的 数值 。 现 在 , 我 们 可 以 使 用 xs 将 一 个 年 份 转换 为 x 坐标 。 类 似 地 , 可 以 使 用 ys 
将 一 个 百分数 转换 为 y 坐标 。 
15. 6. 4 构造 数据 图 

最 后 , 我 们 具备 了 采用 合理 方式 来 编写 图 形 化 代码 的 所 有 先决 条 件 。 首 先 我 们 创建 窗口 并 放 
置 坐标 轴 : 
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Window win(Point(100,100),ximax,ymax,"Aging Japan"); 


Axis x(Axis: :x, Point(xoffset,ymax—yoffset), xlength, 


(end_year-base_year)/10， 

"year 1960 1970 1980 1990 

"2000 2010 2020 2030 2040"); 
x.label.move(—100,0); 


Axis y(Axis::;y, Point(xoffset,ymax—yoffset), ylength, 10,"% of population"); 


Line current_year(Point(xs(2008),ys(0)),Point(xs(2008),ys(100))); 
current_year.set_style(Line_style: :dash); 


坐标 轴 的 交点 Point( xoffset，ymax-yoffset) 表示 (1960, 0) 。 注 意 ， 这 里 是 如 何 放置 刻度 来 反映 数据 
的 。 在 y 轴 上 有 10 个 刻度 , 每 一 个 刻度 代表 10% 的 人 口 。 在 x 轴 上 ，, 每 个 刻度 代表 10 年 , 而 具 
体 的 刻度 数值 是 通过 base_year 和 end_year 计算 得 来 的 , 因此 ， 如果 我 们 改变 这 个 范围 , 该 坐标 轴 
也 会 自动 地 重新 计算 。 这 是 在 代码 中 避免 使 用 “ 魔 数 ” 的 一 个 优点 。 但 是 , 在 x 轴 上 的 标签 违反 了 
这 个 规则 : 它 只 是 用 手动 调整 标签 字符 串 的 方式 得 到 的 结果 ,直到 数字 正好 在 对 应 的 刻度 下 面 。 
更 好 的 方法 是 针对 一 组 单独 的 “刻度 ”给 出 一 组 对 应 的 标签 。 

请 注意 标签 字符 串 的 格式 ,我们 使 用 了 两 个 相 邻 的 文字 常量 字符 串 : 


"year 1960 1970 1980 1990 " 
"2000 2010 2020 2030 2040" 


相 邻 的 文字 常量 字符 串 会 被 编译 器 连接 起 来 , 相当 于 


"year 1960 1970 1980 1990 2000 2010 2020 2030 2040" 
这 是 一 个 用 来 布局 长 字符 串 从 而 使 代码 更 可 读 的 有 用 “技巧 ”。 

current_year 对 象 是 一 条 分 割 已 知 数据 和 预测 数据 的 垂直 线 。 注 意 , 如 何 使 用 xs 和 ys 来 正确 
地 布局 和 按 比 例 缩放 这 条 线 。 

给 定 坐标 轴 ， 我 们 就 可 以 处 理 数据 了 。 定义 3 个 Open_polyline 对 象 ， 在 读 取 循环 中 向 它 它们 添 
加 数据 : 


Open_polyline children; 
Open._polyline adults; 
Open_polyline aged; 


Distribution d ; 
while (ifs>>d) { 
if (d.year<base_year || end_year<d,year) Snort yee out of range"); 
让 (d.young+d.middie+d.old != 100) 
error("percentages don't add up"); 
int x = xs(d.year); 
children.add(Point(x,ys(d.young))); 
adults.add(Point(x,ys(d.middie))); 
aged.add(Point(x,ys(d.old))); 
} 


xs 和 ys 的 使 用 可 以 让 数据 的 放置 和 按 比 例 缩放 变 得 容易 。 像 Scale 这 种 “很 小 的 类 ”对 于 简化 符 
号 和 避免 不 必要 的 重复 是 非常 重要 的 , 能 够 提高 程序 的 可 读 性 和 正确 性 。 
为 了 使 图 形 更 具有 可 读 性 , 我 们 为 每 一 个 图 形 添加 标签 并 设置 颜色 : 


Text children_label(Point(20, children.point(0).y),"age 0-14"); 
children.set_color(Color: :red); 
children_label.set_color(Color: :red); 


Text aduits_label(Point(20,adults.point(0).y),"age 15-64"); 


和 锚 15 便 维 制 函 效 图 和 匆 据 图 


adults.set_color(Color: :blue); 
adults_label.set_color(Color: :blue); 


Text aged_label(Point(20,aged.point(0).y),"age 65+"); 
aged.set_color(Color::dark_green); 
aged_label.set_color(Color: :dark_green); 


最 后 , 我 们 需要 把 不 同 的 Shape 对 象 添加 到 Window 对 象 中 , 然后 启动 GUI 系统 (参见 14. 2.3 节 ): 


win.attach(children); 
win.attach(adults); 
win.attach(aged); 


win.attach(children_jabel); 
win.attach(adults_label); 
win.attach(aged._ label); 


win.attach(x); 

win.attach(y); 

win.attach(current_year); 

gui_main(); 
所 有 代码 都 可 以 放 在 main( ) 中 , 但 我 们 认为 将 辅助 
类 Scale 和 Distribution 与 Distribution 的 输入 操作 符 
一 起 放 在 main( ) 之 外 更 好 。 

假如 你 已 经 忘记 我 们 正在 生成 什么 图 形 , 我 们 
再 次 给 出 输出 结果 ,如 右 图 所 示 。 


人 简单 练习 


晒 数 图 形 化 显示 练习 : 
1. 创建 一 个 标签 为 “Function graphs ”的 空 的 大 小 为 600 x 600 的 Window。 





2. 注意 , 你 可 能 需要 参照 “installation of FLTK”( 可 从 课程 网 站 下 载 ) 中 的 说 明 创 建 一 个 项 目 , 并 设置 项 目 


属性 。 
3. 将 Graph. cpp 和 Window. cpp 移 人 你 的 项 目 中 。 


4. 向 窗口 中 加 入 一 条 x 坐标 轴 和 一 条 y 坐标 轴 , 长 度 均 为 400, 标签 为 "1 ==20 pixels”, 每 隔 20 个 像素 画 一 


个 刻度 。 两 条 坐标 轴 相 交 于 (300, 300) 。 
5. 将 两 条 坐标 轴 都 设置 为 红色 。 
在 下 面 的 练习 中 , 对 每 个 图 形 化 显示 的 天 数 都 使 用 一 个 独立 的 Shape: 


1. 图 形 化 显示 函数 double one( double x) | return 1; | , 参数 范围 [ -10, 11], 原点 (0, 0) 位 于 坐标 氮 (300， 


300), 显示 400 个 点 (400 个 隆 数 值 ), (在 窗口 中 ) 不 缩放 。 
. 将 x 轴 和 Yy 轴 缩放 比例 均 改 为 20。 
. 之 后 所 有 练习 均 使 用 当前 的 参数 范围 和 缩放 比例 等 设置 。 
.将 double slope( double x) | return x/2; } 的 图 形 显 示 加 到 窗口 中 。 
. 用 Text 对象" 2” 为 斜 线 添加 标签 ， 添 加 位 置 为 斜 线 的 左下 角 。 
. 将 double square( double x) | return x* xj; | 的 图 形 显示 加 入 窗口 中 。 
. 问 窗 口中 加 入 余弦 曲线 (不 要 编写 一 个 新 阴 数 )。 
. 将 余弦 曲线 设置 为 蓝 色 。 


‘DO ov 人 


窗口 。 
类 定义 练习 : 
1. 定义 一 个 struct Person, 包含 一 个 类 型 为 string 的 名 字 (name) 和 类 型 为 int 的 年 龄 (age)。 


. 编写 函数 sloping_cos( ) ,将 余弦 曲线 添加 到 slope( ) (如 上 定义 ) 上 , 并 将 此 函数 的 图 形 显 示 加 入 


“从 人 hh 人 


Oo 


9. 
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.定义 一 个 类 型 为 Person 的 变量 , 用 “Goofy” 和 63 对 其 初始 化 ,并 将 其 输出 到 屏幕 (cout) 。 
.为 Person 定义 输入 操纵 符 ( >> ) 和 输出 操纵 符 ( << ) ， 从 键盘 (cin) 读 人 一 个 Person 值 , 并 将 其 写 到 屏幕 


(cout ) 。 


.为 Person 定义 一 个 构造 函数 , 初始 化 name 和 age。 

. 将 Person 的 描述 改 为 private, 并 提供 const 成 员 函 数 name( ) 和 age( ) 实现 名 字 和 年 龄 的 读 取 。 

. 修改 > 和 << , 使 之 适应 重新 定义 过 的 Person。 

.修改 构造 函数 , 检查 age, 保证 它 在 范围 10: 150) 之 内 , 检查 name, 保证 它 不 包含 ; :" '[] * &^% $ 


# @ !。 如 果 发 生 错误 , 使 用 error( ) 。 测 试 这 个 构造 函数 。 


从 标准 输入 ( cin) 读 取 一 组 Person, 存 人 一 个 vector < Person > 中 ; 将 它们 写 到 屏幕 (cout) 。 用 正确 和 错误 


的 输入 数据 测试 这 个 程序 。 
修改 Person 的 描述 ， 用 first_name 和 second_name 代替 name。 如 果 用 户 未 提供 first_name 或 second_name， 
则 给 出 一 个 错误 。 相 应 修改 > 和 << 。 测 试 新 的 类 。 


他 )》 思考 题 


‘D000 -7 On 人 -~ 


pO Oh 
和 ~ LND + 局 ) 


.接受 一 个 参数 的 函数 是 怎样 的 ? 

. 什么 情况 下 你 会 使 用 (连续 的 ) 线 表示 数据 ? 什么 情况 下 你 会 使 用 点 ? 
. 什么 函数 (数学 公式 ) 定 义 一 条 斜 线 ? 

. 什么 是 抛物 线 ? 

. 如 何 生 成 x 轴 和 y 轴 ? 

. 什么 是 默认 参数 ? 什么 时 候 使 用 默认 参数 ? 

.如 何 把 函数 倒 加 在 一 起 ? 

， 如何 给 一 个 图 形 化 的 函数 加 上 颜色 和 标签 ? 

. 我 们 说 一 个 序列 近似 一 个 函数 , 这 是 什么 意思 ? 


. 为 什么 在 编写 代码 绘制 图 形 之 前 需要 画 出 它 的 布局 草图 ? 


. 如何 按 比例 缩放 图 形 使 得 输入 恰好 适合 显示 区 域 ? 
2. 


如 何 按 比例 缩放 输入 , 可 以 避免 试验 和 误差 ? 
. 为 什么 要 格式 化 输入 , 而 不 只 是 让 文件 包含 那些 “数字 ”? 


. 如 何 设计 图 形 的 总 体 布局 ?如 何在 代码 中 反映 出 来 ? 


人 》 术语 


近似 函数 屏幕 布 局 默认 参数 缩放 比例 


<》 习 题 


1. 下 面 是 定义 阶乘 函数 的 另 一 种 方式 : 


DS 


Un 


int fac(int n) { return n>17? n*fac(n—1) : 1; } //factorial n! 

对 于 fac(4), 因为 4>1, 所 以 第 一 次 调用 会 执行 4* fac(3) , 接 下 来 是 4*3*fac(2), 然后 是 4*3*2* 
fac(1) , 即 4*3x#*2*1。 试 着 体会 它 是 怎么 执行 的 。 一 个 末 数 调用 它 自 身 称 为 递归 (recursive) 。 在 15. 5 
节 中 给 出 的 另 一 种 实现 方式 称 为 迁 代 (iterative) ， 因 为 它 对 一 系列 数值 反复 进行 计算 (使 用 while) 。 验 证 
递归 函数 fac( ) 的 执行 过 程 , 并 通过 计算 0, 1, 2, 3, 4, …, 20 的 阶乘 , 验证 是 否 与 迭代 函数 fac( ) 有 相同 
的 执行 结果 。 你 更 倾向 于 fac( ) 的 哪 种 实现 ? 为 什么 ? 


. 定义 一 个 Fct 类 , 除了 存储 构造 函数 的 参数 之 外 , 它 与 Function 类 一 样 。 给 Fet 类 提供 “复位 ”(reset ) 操 


作 , 从 而 可 以 重复 利用 它 对 不 同 的 范围 、 不 同 的 函数 等 生成 图 形 。 


. 修改 上 面 的 Fct 类 , 使 其 带 有 一 个 额外 的 参数 来 控制 精度 或 其 他 内 容 。 为 了 更 加 灵活 , 可 将 该 参数 的 类 型 


设置 为 模板 参数 。 


.在 一 个 图 上 绘制 正弦 (sin( ) )、 余 弦 (cos( ) )、 正 弦 与 余弦 的 和 (sin(x) + cos(x) ) 以 及 正弦 平方 与 余弦 平 


方 的 和 (sin(x) * sin(x) + cos(x) * cos(x) )。 注 意 要 提供 坐标 轴 和 标签 。 


.“ 动 态 显 示 ”( 像 15.5 节 中 那样 ) 序 列 1 -1/3 +1/5 -1/7 +1/9 -1/11 +…。 它 是 著名 的 莱 布 尼 淡 序列 ， 收 
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钱 到 pi/4。 

6. 设计 并 实现 一 个 柱状 图 类 。 它 的 基本 数据 是 一 个 保存 N 个 数值 的 vector < double > , 每 个 数值 用 一 个 矩形 
形状 的 “ 柱 ”( bar) 表示 , 其 高 度 代表 对 应 的 数值 。 

7. 细 化 该 柱状 图 类 , 实现 对 图 本 身 和 每 一 个 单独 的 柱 添加 标签 的 功能 , 并 允许 使 用 颜色 。 

8. 有 一 个 以 厘米 为 单位 的 身高 ( 取 整 到 最 接近 的 5 cm 的 整数 倍 ) 和 身高 为 对 应 值 的 人 数 构成 的 集合 : (170， 
7)，(175, 9), (180, 23), (185, 17), (190, 6) , (195, 1) 。 如 何 图 形 化 这 些 数据 ? 如 果 你 想不到 更 好 
的 方法 ,做 一 个 柱状 图 。 记 得 提供 坐标 轴 和 标签 。 把 数据 放 在 一 个 文件 中 , 并 从 该 文件 读 取 这 些 数据 。 

9. 找 另 一 个 身高 的 数据 集合 , 然后 用 前 面 练习 中 的 程序 图 形 化 这 些 数据 。 例 如 ,从 网 上 搜索 “身高 分 布 ” 或 
者 “美国 人 的 身高 ", 并 忽略 没 用 的 内 容 , 或 者 向 你 的 朋友 询问 他 们 的 身高 。 理 想 情况 下 , 你 不 需要 对 新 
的 数据 集 做 任何 改变 。 关 键 思路 是 计算 出 数据 的 缩放 比例 。 从 输入 中 读 取 标签 也 有 助 于 代码 重用 时 尽量 
少 地 修改 代码 。 

10. 什么 样 的 数据 不 适合 用 线 图 或 者 柱状 图 表示 ? 寻找 一 个 例子 , 给 出 显示 它 的 一 种 方法 (例如 , 一 个 标记 

点 的 集合 ) 。 
11. 计算 两 个 或 者 更 多 地 点 (例如 , 英格兰 的 剑桥 和 马萨诸塞 州 的 剑桥 ; 有 很 多 城镇 叫做 “剑桥 ” ) 一 年 中 每 
个 月 的 平均 最 高 气温 , 并 将 它们 显示 在 一 张 图 上 。 注 意 坐 标 轴 、 标 签 、 颜 色 的 使 用 等 。 


全 》 附 言 

数据 的 图 形 表示 是 重要 的 。 与 一 组 数据 相 比 , 我 们 更 容易 理解 由 数据 制作 而 得 到 的 图 。 当 需要 绘制 图 
形 的 时 候 , 大 部 分 人 都 会 使 用 其 他 人 的 代码 一 一 郴 数 库 。 这 些 库 是 如 何 构造 的 呢 ? 而 如 果 你 手头 没有 这 样 
一 个 库 , 又 该 如 何 做 呢 ?“ 一 个 普通 的 绘图 工具 ”之 下 的 基本 思想 是 什么 呢 ? 现在 你 已 经 知道 ; 它 不 是 神秘 
的 魔术 或 者 脑 外 科 手 术 。 我 们 只 讨论 了 二 维 图 形 ; 而 三 维 图 形 化 表示 在 科学 、 工 程 、 市 场 等 领域 同样 非常 有 
用 , 甚至 更 加 有 趣 。 将 来 如 有 恰当 的 时 机 , 请 仔细 研究 它们 ! 





第 16 章 图 形 用 户 乔 面 


“计算 不 再 是 指 计算 机 ， 而 是 生活 。 





Nicholas Negroponte 


图 形 用 户 界 面 (GUI) 允许 用 户 通过 点 击 按钮 、 选 择 菜单 、 以 不 同 的 方式 输入 数据 以 及 在 屏幕 
上 显示 文本 和 图 形 等 方式 与 程序 进行 交互 。 这 正 是 我 们 与 电脑 以 及 网 站 交互 时 经 常 采用 的 方式 。 
在 本 章 中 , 我 们 将 介绍 编写 代码 来 定义 和 控制 GUI 应 用 的 基本 方法 。 特 别 地 , 我 们 将 介绍 如 何 编 
写 代码 , 通过 回调 函数 与 屏幕 上 的 实体 进行 交互 。 我 们 的 GUI 工具 是 建立 在 系统 工具 之 上 的 。 附 
录 下 给 出 了 更 低层 次 的 特性 和 接口 ,这些 特 性 和 接口 使 用 了 第 17 章 和 第 18 章 中 介绍 的 特性 和 技 
术 。 在 本 章 中 , 我 们 将 注意 力 集中 在 使 用 方法 上 。 


16. 1 用 户 界 面 的 选择 


每 个 程序 都 有 用 户 接口 。 在 小 装置 上 运行 的 程序 的 接口 可 能 局 限于 从 几 个 按钮 输入 和 用 一 
个 闪光 信号 灯 输 出 。 而 其 他 的 计算 机 仅仅 通过 一 条 线 就 可 以 连接 到 外 面 的 世界 。 这 里 , 我 们 将 考 
虑 一 般 的 情况 ,， 即 程序 是 和 一 个 看 着 屏幕 、 使 用 键盘 和 定点 设备 (如 鼠标 ) 的 用 户 进行 交互 。 在 这 
种 情况 下 , 程序 员 有 三 种 主要 的 选择 : 
。 使 用 控制 台 输 入 /输出 : 对 于 专业 技术 工作 而 言 , 这 是 一 种 强 有 力 的 方式 , 输入 是 简单 的 、 
文本 式 的 ， 由 一 些 命令 和 短 数据 项 ( 比如 文件 名 或 者 简单 的 数值 ) 组 成 。 如 果 输 出 也 是 文 
本 式 的 , 我 们 可 以 将 它 显 示 在 屏幕 上 或 者 存储 在 文件 中 。C ++ 的 标准 库 iostream (参见 
第 10 ~11 章 ) 为 这 种 方式 提供 了 适合 、 方 便 的 机 制 。 如 果 需 要 图 形 输出 , 我 们 可 以 使 用 一 
个 图 形 显示 库 ( 参 见 第 12 ~ 15 章 ), 不 需要 对 我 们 的 程序 设计 风格 进行 明显 的 修改 。 
。 使 用 图 形 用 户 界面 (GUI) 库 : 用 户 的 交互 基于 操纵 屏幕 对 象 的 方式 ( 定点、 点击、 拖 放 、 悬 
停 等 ) 。 通 常 (但 不 总 是 ) ,这 种 方式 总 是 伴随 着 信息 的 高 度 图 形 化 显示 。 任 何 用 过 现代 计 
算 机 的 人 都 能 举 出 一 些 体现 这 种 方式 便利 性 的 例子 。 任 何 希望 感受 Windows/ Mac 应 用 的 
人 都 需要 使 用 GUI 交互 方式 。 
。 使 用 网 络 浏览 器 界面 : 对 于 这 种 方式 , 我 们 需要 使 用 一 种 标记 (布局 ) 语 言 , 例 如 HTML， 
通常 还 会 使 用 一 种 脚本 语言 。 阐 述 如 何 实 现 这 种 方式 已 经 超出 了 本 书 的 讨论 范围 , 但 一 
般 来 说 , 它 是 有 远程 访问 需求 的 应 用 程序 的 理想 模式 。 在 这 种 方式 下 , 程序 和 屏幕 之 间 的 
通信 还 是 文本 方式 的 (使 用 字符 流 ) 。 浏 览 器 是 一 个 GUI 应 用 程序 , 它 负责 将 其 中 一 些 文 
本 信息 转换 成 图 形 元 素 , 并 将 鼠标 点 击 等 转换 成 文本 数据 传递 回程 序 。 
对 于 很 多 人 来 说 ，GUI 的 使 用 就 是 现代 程序 设计 的 本 质 , 而 且 有 时 与 屏幕 对 象 的 交互 被 认为 是 程 
序 设计 的 核心 概念 。 我 们 并 不 同意 这 种 观点 : GUI 是 一 种 VO 形式 , 应 用 程序 的 主要 逻辑 和 IO 
相互 分 离 是 软件 设计 的 主要 观点 之 一 。 无 论 是 否 可 能 , 我 们 更 愿意 在 主要 程序 逻辑 和 用 来 进行 输 
人 /和 输出 的 部 分 之 间 建 立 起 一 个 清晰 的 接口 。 这 种 分 离 机 制 允 许 我 们 通过 改变 程序 呈现 给 用 户 的 
方式 , 来 将 程序 移植 到 不 同 的 IO 系统 中 , 更 重要 的 是 , 这 种 机 制 允 许 我 们 将 程序 逻辑 和 用 户 交 
互 分 开 来 考虑 。 
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也 就 是 说 ,从 多 个 角度 来 看 ,， GUI 都 是 非常 重要 和 有 趣 的 。 本 章 既 研 乔 如何 把 图 形 元 条 集成 
到 我 们 的 应 用 程序 中 , 同时 也 探索 如 何 防 止 对 界面 的 过 度 关 注 而 影响 我 们 的 思维 。 


16. 2 “Next” 按 钮 


如 何 提供 一 个 像 第 12 ~ 15 章 的 例子 中 用 于 驱动 图 形 显示 的 Next" 按钮 呢 ? 在 那里 , 我 们 使 
用 窗口 中 的 一 个 按钮 绘制 图 形 。 很 明显 , 这 是 一 种 简单 的 GUI 程序 设计 模式 。 实 际 上 , 因为 它 过 
于 简单 ,以 至 于 有 些 人 可 能 会 争论 它 是 不 是 一 个 "真正 的 GUI”。 无 论 如 何 , 让 我 们 看 看 它 是 怎样 
实现 的 ,因为 它 将 引领 我 们 直接 进入 所 有 人 都 认可 的 真正 的 GUI 程序 设计 。 

第 12 ~ 15 章 中 代码 的 典型 结构 如 下 ; 

I create objects and/or manipulate objects, display them in Window win: 


win.wait_for_button(); 


/i create objects and/or manipulate objects, display them in Window win: 
win.wait_for_button(); 


/ create objects and/or manipulate objects, display them in Window win: 

win.wait_for_button(); 
每 当 运行 到 wait_for_button( ) , 就 可 以 在 屏幕 上 看 到 要 显示 的 对 象 , 直到 我 们 点 击 按钮 来 得 到 程 
序 下 一 部 分 的 输出 。 从 程序 逻辑 的 观点 来 看 , 这 种 方式 与 逐 行 输出 到 屏幕 (控制 台 窗 口 ), 在 某 处 
停 下 来 , 然后 再 从 键盘 接收 输入 的 程序 没有 区 别 。 例 如 : 


// define variables and/or compute values, produce output 
cin>> var; /waitfor input 


1 define variables and/or compute values, produce output 
cin>>var; /wait for input 


1 define variables and/or compute values, produce output 

cin>> var; /waitfor input 
但 是 从 实现 的 观点 来 看 , 这 两 种 程序 截然 不 同 。 当 你 的 程序 执行 到 cin >> var 时 , 它 停 下 来 并 且 等 
待 ” 系统 " 读 取 你 输入 的 字符 。 然 而 ,监视 屏幕 并 且 跟 踪 鼠 标的 系统 ( 图形 用 户 界 面 系统 ) 运 行 在 
一 种 截然 不 同 的 模式 下 ; GUI 跟踪 鼠标 的 位 置 和 用 户 对 鼠标 所 做 的 操作 (点 击 等 )。 当 你 的 程序 需 
要 一 个 动作 时 , 它 必须 

e。 告诉 GUI 关心 哪些 事情 (例如 ,“ 有 人 点 击 了 “Next' 按钮 ”)。 

® 告诉 GUI 当 有 人 做 这 些 事 的 时 候 , 应 该 如 何 处 理 。 

。 在 GUI 检测 到 程序 感 兴趣 的 动作 之 前 一 直 处 于 等 待 状态 。 
与 控制 台 程 序 的 不 同 之 处 在 于 ，GUI 并 不 是 简单 地 返回 我 们 的 程序 ; 它 的 设计 目标 是 对 很 多 不 同 
的 用 户 动作 给 出 不 同 的 响应 , 例如 点 击 很 多 按钮 中 的 某 一 个 、 改变 窗 口 的 尺寸 、 当 窗口 被 其 他 内 
容 挡住 之 后 重新 绘制 窗口 以 及 弹出 “弹出 式 "菜单 等 。 

首先 , 我 们 只 是 想 说 ,“ 当 有 人 按 下 我 的 按钮 时 请 将 我 唤醒 ” ; 也 就 是 说 ,“ 当 有 人 点 击 鼠 标 按 
钮 , 且 光 标 位 置 在 我 的 按钮 图 形 显示 的 矩形 区 域内 时 , 请 继续 执行 我 的 程序 ”。 这 是 我 们 能 够 想 
象 到 的 最 简单 的 动作 。 然 而 , 这 样 的 操作 并 不 是 由 " 系统 ” 提供 的 ， 所 以 我 们 必须 自己 编写 代码 。 
观察 它 的 实现 方法 是 理解 GUI 程序 设计 的 第 一 步 。 


16. 3 一 个 简单 的 窗口 
实际 上 ,“ 系 统 ”( GUI 库 和 操作 系统 的 组 合 ) 不 断 跟 踪 鼠 标的 位 置 及 其 按钮 是 否 被 按 下 。 一 
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个 程序 可 以 关注 屏幕 的 某 个 区 域 , 并 请 求 “系统 ”在 某 些 被 关注 的 事件 发 生 时 调用 某 个 函数 。 在 本 
例 中 , 我 们 请 求 系统 当 用 户 在 “我 们 的 按钮 * 上 点 击 鼠 标 时 , 调用 我 们 的 一 个 函数 (“回调 函数 ”)。 
。 定义 一 个 按钮 
e 显示 按钮 
e 定义 一 个 GUI 可 以 调用 的 函数 
。 将 定义 的 按钮 和 函数 告知 GUI 
。 等 待 GUI 调用 我 们 的 函数 
下 面 进行 具体 实现 。 按 钮 是 Window 的 一 部 分 , 所 以 我 们 (在 hb window. h 中 ) 定 义 了 类 Simple 
_window， 这 个 类 包括 数据 成 员 next_button ， 


struct Simple_window : Graph_lib::Window { 
Simple_window(Point xy int w, int h, const string& title ); 


void wait for button0;  //simple event loop 
private: 

Button next_button; j the “Next” button 

bool button_pushed; // implementation detail 


static void cb_next(Address, Address); // callback for next_button 
void next(); //action to be done when next_button is pressed 


}; | 
很 显然 , 类 Simple_window 派生 自 Graph_lib 库 的 Window 类 。 所 有 的 窗口 都 必须 直接 或 者 间接 地 
派生 自 Graph_lib :: Window 类 , 因为 它 是 将 我 们 对 窗口 的 设想 和 系统 的 窗口 实现 (通过 FLTK) 连接 
起 来 的 类 。 对 于 Window 类 实现 的 细节 , 可 参考 附录 E. 3。 

我 们 的 按钮 在 Simple_Window 的 构造 旺 数 中 被 初始 化 ; 


Simple_window::Simpie_window(Point xy int w, int h, const string& title) 
:Window(xy,w,h,title), 
next_button(Point(x_max()~70,0), 70, 20, "Next”, cb _next), 
button_pushed(fajse) 
{ 
attach(next_button); 
} 


不 出 意外 的 ，Simple_window 将 上 自己 的 位 置 (xy), 尺寸 (w, h) 和 标题 (title ) 传递 给 Graph_lib 的 
Window 类 来 处 理 。 接 下 来 ,构造 盟 数 使 用 位 置 ( Point(x_max( ) -70, 0), 大 致 位 于 右上 角 )、 尺 
寸 (70, 20)、 标 签 (”" Next” ) 和 一 个 “回调 " 画 数 (cb_next) 初 始 化 next_button。 前 四 个 参数 的 作用 
与 我 们 对 Window 所 做 的 相同 : 将 一 个 矩形 形状 放 在 屏幕 上 并 且 为 它 添加 标签 。 

最 后 , 我 们 将 next_button 按钮 添加 到 Simple_window 中 ; 也 就 是 说 , 告知 窗口 必须 要 将 这 个 按 
钮 显示 在 它 的 位 置 上 , 并 且 保 证 GUI 系统 知道 它 的 存在 。 

button_pushed 成 员 是 一 个 相当 隐 星 的 细节 ; 我 们 用 它 来 跟踪 目 从 上 次 执行 next( ) 起 到 现在 按 
钮 是 否 被 按 下 。 事 实 上 ， 这 里 做 的 每 件 事 基本 上 都 必 于 实现 细节 ， 因此 将 其 声明 为 private。 忽 梧 
实现 细节 后 的 代码 为 : 


struct Simple_window : Graph_lib: :Window { 
Simple_window(Point xy int w, int h, const string& title ); 


void wait_for_button0;  //simple event loop 


Nh... 
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也 就 是 说 , 用 户 可 以 创建 一 个 窗口 并 等 待 按 钮 被 按 下 。 
16. 3. 1 回调 范 数 

此 处 ,函数 cb_next( ) 是 一 个 新 的 , 而 且 很 有 趣 的 代码 。 它 就 是 当 GUI 系统 检测 到 按钮 被 按 
下 时 , 我 们 希望 GUI 系统 调用 的 那个 函数 。 由 于 我 们 将 该 函数 交 给 GUI, 以 便 GUI 能 “ 回 过 头 来 
调用 我 们 ”, 所 以 它 通常 被 称 为 “回调 函数 ” 。 我 们 通过 它 的 前 缀 cb_ 代 表 “ 回调” 来 指出 cb_next( ) 
的 用 途 。 前 级 的 作用 只 是 帮助 我 们 理解 一 没有 任 
何 语言 或 者 库 有 这 样 的 命名 要 求 。 很 明显 , 我 们 选 
择 名 字 cb_next 是 因为 它 是 “Next” 按钮 的 回调 函数 。 
cb_next 的 定义 是 一 段 比较 丑陋 的 “样本 ”代码 。 

在 给 出 代码 之 前 , 先 让 我 们 看 看 这 里 发 生 的 事 
情 , 如 右 图 所 示 。 我 们 的 程序 是 运行 在 多 “ 层 ” 代 码 | 操作 系统 图 形 /GUI 功 能 
之 上 的 。 它 使 用 我 们 的 图 形 库 , 而 图 形 库 是 利用 
FLTK 库 实现 的 ，FLTK 库 又 是 使 用 操作 系统 功能 实 
现 的。 在 一 个 系统 中 , 可 能 还 会 有 更 多 的 层 和 子 层 。 无 论 以 什么 方式 , 当 和 鼠标 设备 驱动 检测 到 点 
击 操作 时 , 我 们 的 函数 cb_next( ) 必须 被 调用 。 我 们 将 cb_next( ) 的 地 址 和 Simple_window 对 象 的 
地 址 经 过 软件 层次 向 下 传递 ; 当 “ Next" 按钮 被 按 下 时 , 一些“ 下层 ”的 代码 就 会 调用 cb_next( ) 
函数 。 

GUI 系统 ( 和 操作 系统 ) 可 以 被 不 同 语言 编写 的 程序 使 用 , 所 以 它 不 能 向 所 有 用 户 强加 一 些 好 
的 C++ 风格 。 特 别 地 , 它 并 不 知道 我 们 的 Simple_window 类 或 者 Button 类 。 事 实 上 , 它 根本 就 不 
知道 类 和 成 员 函 数 的 概念 。 回 调 函 数 的 类 型 是 经 过 小 心 选择 的 , 以便 可 被 低层 的 程序 设计 (包括 
C 和 汇编 ) 所 用 。 回 调 函数 是 没有 返回 值 的 , 它 接受 两 个 地 址 参数 。 我 们 可 以 遵从 这 些 规则 来 声 
明 一 个 C++ 成 员 晴 数 如 下 : : 

static void cb_next(Address, Address);  // callback for next_button 
关键 字 static 用 于 保证 cb_next( ) 可 以 作为 一 个 普通 函数 被 调用 ; 也 就 是 说 , 不 是 作为 针对 某 个 特 
定 对 象 的 C++ 成员 函数 被 调用 。 令 系统 能 够 正确 调用 一 个 C++ 成员 函 数 当然 很 好 , 但 回调 接口 
必须 能 被 多 种 语言 所 用 , 所 以 我 们 只 能 将 其 定义 为 static 类 型 的 成 员 肾 数 。Address 参数 指明 cb_ 
next( ) 的 参数 是 “内 存 中 某 些 内 容 ” 的 地 址 。 大 部 分 语言 都 不 支持 C++ 语言 的 引用 , 所 以 这 里 不 
能 使 用 引用 。 编 译 器 并 不 告诉 你 “那些 内 容 ” 是 什么 类 型 的 。 在 本 例 中 , 我 们 非常 接近 底层 硬件 ， 
不 能 像 往常 那样 从 语言 中 得 到 帮助 。“ 系 统 "激活 一 个 回调 函数 时 , 传递 给 它 的 第 一 个 参数 是 触发 
回调 的 GUI 实体 (Widget) 的 地 址 。 本 例 中 不 需要 使 用 第 一 个 参数 ,所 以 我 们 不 关心 它 的 命名 。 第 
二 个 参数 包含 这 个 Widget 的 窗口 的 地 址 ; 对 于 cb_next( ) 来 说 , 它 是 我 们 的 Simple_window 对 象 。 
我 们 可 以 按照 如 下 方式 使 用 这 个 信息 : 


void Simple_window::cb_next(Address, Address pw) 
// call Simple_window::next() for the window located at pw 
{ 
reference_to<Simple_window>(pw),next(); 
} 


reference_to < Simple_window > (pw ) 告诉 编译 器 pw 中 的 地 址 可 以 认为 是 Simple_window 对 象 的 地 
址 ; 也 就 是 说 , 我 们 可 以 将 reference_to < Simple_window > (pw) 当做 Simple_window 对 象 的 引用 来 
使 用 。 在 第 17、18 章 中 , 我 们 将 回 到 内 存 寻 址 的 话题 。 在 附录 .1 中 , 我们 给 出 了 reference-to 的 
定义 。 现 在 , 我 们 只 是 乐于 看 到 最 后 获得 了 一 个 指向 Simple_window 对 象 的 引用 , 这 样 就 可 以 像 


_ 一 代码 “ 层 ” 的 例子 
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以 往 那样 访问 我 们 的 数据 和 函数 。 最 后 , 通过 调用 我 们 的 成 员 肾 数 next( ) ， 尽 可 能 快 地 脱离 和 系 
统 有 关 的 代码 。 

我 们 本 来 可 以 将 所 有 想 要 执行 的 代码 都 放 在 cb_next( ) 中 , 但 是 像 大 多 数 好 的 GUI 程序 设计 
者 一 样 , 我 们 更 愿意 把 这 些 麻烦 的 低层 内 容 和 精巧 的 用 户 代码 相 分 离 ， 所 以 使 用 下 面 两 个 函数 来 
处 理 回调 : 

e cb_next( ) 简单 地 将 回调 函数 的 系统 约定 映射 到 一 个 普通 的 成 员 函 数 (next( ) ) 。 

。 next( ) 实现 我 们 实际 要 做 的 事情 (不 需要 知道 回调 函数 的 系统 约定 ) 。 
使 用 两 个 函数 的 本 质 原因 是 一 个 通用 设计 原则 , 即 “ 一 个 函数 应 该 执行 单一 的 逻辑 行为 ”: cb_next( ) 
使 我 们 脱离 了 低层 系统 相关 的 部 分 , next( ) 执行 我 们 期 望 的 动作 。 任 何 时 候 ， 当 我 们 需要 一 个 (来 
自 “ 系 统 ” 的 ) 对 我 们 窗口 的 回调 时 , 就 可 以 定义 这 样 一 对 肾 数 ; 例如 ,可 以 参考 16.5 节 ~ 16.7 
节 。 继 续 下 一 步 之 前 , 先 重复 一 下 到 目前 为 止 我 们 做 了 什么 : 

e 定义 了 Simple_window 类 。 

e Simple_window 的 构造 肾 数 将 next_button 对 象 注册 到 GUI 系统 。 

。 当 点 击 屏幕 上 的 next_button 时 ,GUI 调用 cb_next( ) 随 数 。 

。 cb_next( ) 将 低层 的 系统 信息 转换 成 对 窗口 成 员 函 数 next( ) 的 调用 。 

@ next( ) 执行 我 们 想 要 做 的 事情 以 响应 按钮 点 击 的 动作 。 
这 是 进行 函数 调用 的 一 个 相当 完美 的 方法 。 不 过 要 记 住 , 我 们 是 在 处 理 鼠 标 ( 或 者 其 他 硬件 设备 ) 
动作 和 程序 之 间 的 基本 通信 机 制 。 特 别 地 : 

。 通常 有 很 多 程序 同时 在 运行 。 

。 这 些 程序 都 是 在 操作 系统 之 后 很 久 才 编写 的 。 

“。 这 些 程序 都 是 在 GUI 库 之 后 很 久 才 编写 的 。 i 
e 这 些 程序 所 用 的 语言 可 能 和 实现 操作 系统 的 语言 完全 不 同 。 
e 这 种 技术 处 理 所 有 类 型 的 交互 (不 仅仅 是 按 下 按钮 这 样 的 小 例子 ) 。 
_e 一 个 窗口 可 以 有 很 多 按钮 ; 一 个 程序 可 以 有 很 多 和 窗口。 

不 过 , 一 旦 理解 了 next( ) 是 如 何 被 调用 的 , 我 们 就 从 本 质 上 理解 了 如 何 使 用 GUI 接口 来 处 理 程序 
中 所 有 的 动作 。 
16. 3. 2 ”等待 循环 

那么 , 在 这 种 最 简单 的 情况 下 , 我们 希望 Simple_window 的 next( ) 孔 数 在 每 次 按 下 按钮 的 时 
候 做 些 什 么 呢 ? 本 质 上 ，, 我 们 需要 一 个 能 将 程序 停止 在 某 个 点 上 的 操作 , 以便 有 机 会 观察 到 目前 
为 止 已 经 完成 了 哪些 工作 。 同 时 还 希望 next( ) 函数 能 够 从 停止 点 重新 启动 程序 : 


// create some objects and/or manipulate some objects, display them in a window 
win.wait_ for_button(); // next() causes the program to proceed from here 
// create some objects and/or manipulate some objects 


实际 上 , 这 很 容易 做 到 。 首 先 定义 wait_for_button( ) : 
void Simple_ window::wait for_ button() 
// modified event loop: 
/ handle all events (as per default), quit when button_pushed becomes true 
// this allows graphics without control inversion 


while (1button_pushed) Fl: :wait(); 
button_pushed = false; 
Fl::redraw(); 
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像 大 多 数 GUI 系统 一 样 ，FLIK 提供 了 一 个 停止 程序 运行 的 函数 ,直到 某 个 事件 发 生 才 重启 程序 。 
这 个 FLTK 版 本 的 函数 称 为 wait( ) 。 实 际 上 , wait( ) 需 要 关注 很 多 事情 , 因为 发 生 任何 影响 我 们 程 
序 的 事件 都 会 将 程序 唤醒 。 例 如 ， 如果 程 序 运行 在 Microsoft Windows 环境 下 ， 当 窗口 被 移动 或 者 
被 其 他 窗口 速 挡 时 , 窗口 的 重新 绘制 工作 是 由 程序 来 完成 的 。Window 类 还 需要 处 理 调整 窗口 尺 
二 的 工作 。 在 默认 情况 下 ,HL:: wait( ) 会 处 理 所 有 这 些 工作 。 每 当 wait( ) 函数 处 理 完成 某 个 事件 
后 , 它 总 会 返回 ,使 我 们 的 代码 有 机 会 处 理 一 些 事情 。 

因此 ， 当 有 人 人 点击” Next ”按钮 时 ，wait( ) 就 会 调用 cb_next ( ) 并且 返回 (到 我 们 的 “等 待 循 
环 ”) 。 为 了 使 wait_for_button ( ) 继续 运行 ，next( ) 只 需 将 布尔 变量 button_pushed 设置 为 true。 这 
很 容易 : 

void Simple_window: :next() 

{ 


button_pushed = true; 


} 


当然 , 还 需要 在 某 个 合适 的 地 方 预先 定义 button_pushed: 
bool button_pushed = false; 


等 待 之 后 ，wait_for_button( ) 需 要 将 button_pushed 复位 并 且 重 绘 (redraw( ) ) 窗口 以 保证 我 们 所 做 : 
的 任何 改变 都 能 够 在 屏幕 上 表现 出 来 ,这 就 是 它 所 做 的 全 部 工作 。 


16. 4 ”Button 和 其 他 Widget 
定义 如 下 按钮 : 


struct Button : Widget { 
Button(Point xy int w, int h, const string& label, Callback cb); 
void attach(Window&); 

}; 


由 此 可 知 , 按钮 (Button) 是 一 个 具有 位 置 (xy) 、 尺 寸 (w、h) 、 文本 标签 (label) 和 回调 函数 (cb) 的 
Widget。 基 本 上 , 任何 出 现在 屏幕 上 , 带 有 关联 动作 (例如 回调 函数 ) 的 东西 都 是 Widget。 
16. 4.1 Widget z 


是 的 ,构件 (widget) 是 一 个 技术 术语 。 构 件 还 有 另 一 个 名 字 一 一 控件 (control) , 虽然 更 具 描 
述 性 , 但 不 够 形象 。 我 们 使 用 构件 来 定义 通过 GUI( 图形 用 户 界面 ) 与 程序 进行 交互 的 形式 。 
Widget 接口 类 如 下 : 

class Widget { 
// Widget is a handle to an FL_widget — it is *not* an Fl_widget 
// we try to keep our interface classes at arm’s length from FLTK 
public: ; 
Widget(Point xy int w int h, const string& s, Caliback cb); 


virtual void move(int dx,int dy); 
virtual void hide(); 

virtual void show(); 

virtual void attach(Window&) = 0; 


Point loc; 

int width; 

int height; 

string [abel; 
Callback do it; 
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protected: | 
Window* own;  //every Widget belongs to a Window 
Fl Widget* pw; /connection to the FLTK Widget 

»; 


Widget 有 两 个 有 趣 的 隔 数 , 我 们 可 以 将 它们 用 在 Button 上 (以 及 很 多 其 他 从 Widget 派生 出 来 的 
类 , 例如 Menu; 参见 16.7 节 ) : 
e hide( ) 使 Widget 对 象 不 可 见 。 
。 show( ) 使 Widget 对 象 再 次 可 见 。 
一 个 Widget 对 象 开 始 是 可 钨 的 。 

如 同 Shape 对 象 一 样 , 我 们 可 以 在 Window 中 移动 (move( ) ) 一 个 Widget 对 象 , 不 过 在 进行 该 
操作 之 前 必须 把 它 添加 到 Window 对 象 中 。 注 意 , 我 们 将 attach ( ) 声明 为 一 个 纯 虚 函数 (参见 
14. 3.5 节 ): 每 一 个 派生 目 Widget 的 类 必须 定义 它 自己 的 attach( ) 函数 。 事 实 上 ,系统 级 构件 是 
在 attach( ) 函数 中 创建 的 。 作 为 Window 目 己 的 attach( ) 函数 实现 的 一 部 分 ， a a ， 站 数 
是 由 Window 对 象 调 用 的 。 实 际 上 , 连接 窗口 和 构件 如 同 WE 
跳 双 人 有 舞蹈， 各自 必 须 完 成 自己 的 那 部 分 工作 。 最 终结 果 
就 是 一 个 窗口 知道 它 所 包含 的 构件 , 而 每 个 构件 也 知道 它 
所 属 的 窗口 ， 如 右 图 所 示 。 注 意 , 一 个 Window 对 象 并 不 
知道 它 所 处 理 的 Widget 的 类 型 。 如 14.4 和 14.5 节 中 描述 z 
的 那样 , 我 们 使 用 面向 对 象 程序 设计 来 保证 Window 可 以 处 理 每 种 类 型 的 Widget。 同 样 , 一 
Widget 对 象 也 不 知道 它 所 属 的 Window 的 类 型 。 

这 个 实现 还 不 够 完美 , 因为 我 们 将 数据 成 员 定义 为 外 部 可 访问 的 。 而 own 和 pw 是 严格 用 于 
派生 类 实现 的 , 所 以 我 们 将 它们 声明 为 protected。 

在 GUL h 中 可 以 找到 Widget 类 以 及 我 们 所 使 用 的 具体 构件 类 ( Button、Menu 等 ) 的 定义 。 

16. 4.2 Button z z : z 
Button 是 一 个 最 简单 的 Widget， 当 我 们 点 击 按钮 的 时 候 , 其 功能 只 是 调用 一 个 回调 函数 : 


class Button : public Widget { 
public: 
Button(Point xy int ww, int hh, const string& s, Callback cb) 
:Widget(xy,ww,hh,s, ch) {} 





void attach(Window& win); 
}; 


这 就 是 全 部 代码 。attach( ) 函数 包含 所 有 (相对 ) 繁琐 的 FLTK 代码 。 我 们 将 在 附录 E 中 进行 相 的 
介绍 (在 读 完 第 17、18 章 之 前 不 要 去 阅读 附录 卫 ) 。 现 在 , 你 只 需要 知道 定义 一 个 Widget 并 不 是 
特别 困难 。 : : 

我 们 并 不 处 理 按钮 (或 其 他 Widget) 的 外 观 , 这 个 问题 有 些 复杂 和 棘手 。 问 题 在 于 , 对 于 外 观 
风格 我 们 几乎 有 无 限 多 种 选择 , 而 有 些 风格 是 系统 强制 要 求 的 。 而 且 , 从 程序 设计 技术 的 角度 来 
看 , 呈现 不 同 的 按钮 外 观 并 不 需要 任何 新 知识 。 如 果 这 令 你 失望 的 话 , 你 可 以 注意 这 样 一 个 事 
实 , 将 一 个 Shape 对 象 放置 在 一 个 按钮 上 面 ， 并 不 会 对 按钮 的 功能 造成 任何 影响 , 而 且 你 已 经 知 
道 了 如 何 生成 任何 需要 的 形状 。 

16. 4.3 In box 和 Out_box 
我 们 提供 了 两 种 Widget, 用 于 文本 输入 /输出 : 
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struct In_box : Widget { 
In_box(Point xy int w, int h, const string& s) 
:Widget(xy,w,h,s,0) {} 
int get_int(); 
string get_string(); 


void attachf(Window& win); 
}; 


struct Out_box : Widget { 
Out_box(Point xy int w, int h, const string& s) 
:Widget(xy,w,h,s,0) { } 
void put(int); 
void put(const string&); 


void attach(Window& win); 
}; 
In_box 能 够 接受 输入 给 它 的 文本 , 我 们 可 以 使 用 get_string( ) 将 文本 作为 字符 串 读 出 或 者 使 用 get_ 
int( ) 将 其 作为 整数 读 出 。 如 果 你 想 知 道 是 否 已 经 有 文本 输入 , 可 以 使 用 get_string( ) 读 取 并 检查 
是 否 得 到 了 空 字 符 串 : 
string s = some_inbox.get_string(); 
if (s =="") { 


I/ deal with missing input 
} 


Out_box 用 来 向 用 户 呈 现 信息 。 与 In_box 类 似 , 我 们 可 以 使 用 put( ) 输 出 字符 串 或 者 整数 。16.5 
节 给 出 了 使 用 In_box 和 Out_box 的 例子 。 

我 们 并 没有 提供 get_floating_point( ) 、get_complex( ) 等 函数 。 但 不 必 为 此 担心 , 因为 你 可 以 获 
得 字符 捉 , 并 将 它 放 人 一 个 stringstream 中 , 就 可 以 按 你 喜欢 的 方式 做 任意 的 格式 化 输入 了 (参见 
11;4 节 )。 


16.4.4 Menu 
我 们 提供 了 一 个 非常 简单 的 “菜单 ”的 概念 : 
struct Menu : Widget { 


enum Kind { horizontal, vertical }; 

Menut{Point xy int w, int h, Kind kk, const string& label); 
Vector_ref<Button> selection; 

Kind k; 

int offset; 

int attach(Button& b); I attach button to Menu 

int attach(Button* p); I attach new button to Menu 


void show!) I show all buttons 
{ 
for (unsigned int i = 0; i<selection.size(); ++i) 
selection[i].show'(); 


} 
void hide(); I hide all buttons 
void move(int dx, int dy); I move all buttons 


void attach(Window& win); attach all buttons to Window win 
}; 


Menu 本 质 上 是 一 个 按钮 向 量 。 跟 以 前 一 样 ，Point 对 象 xy 指出 左上 和 角 的 位 置 。 宽 度 和 高 度 的 作 
用 是 ， 当 给 菜单 添加 按钮 的 时 候 , 用 来 重 设 按钮 大 小 。 参 见 16.5 节 和 16.7 节 的 例子 。 每 一 个 
菜单 按钮 (“菜单 项 ” ) 是 一 个 独立 的 Widget, 作为 attach( ) 的 参数 提供 给 Menu。 接 着 ，Menu 提 
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供 一 个 attacht( ) 操作 将 所 有 Button 添加 到 Window 对 象 。Menu 对 象 使 用 Vector_ref( 参见 13. 10 


节 和 附录 E.4) 跟 踪 它 的 所 有 的 Button。 如 果 想 要 一 个 “弹出 式 " 菜 单 ,你 只 能 目 己 创建 一 个 ; 
参见 16.7 节 。 


16.5 一 个 实例 


为 了 更 好 地 感受 基本 的 GUI 工具 , 我 们 给 出 了 一 个 简单 的 应 用 程序 , 它 是 一 个 包含 输入 、 输 
出 和 一 些 图 形 的 窗口 : 
这 个 程序 允许 用 户 绘制 一 系列 由 坐标 对 指定 的 线段 (开放 多 线段 ; 参见 13.6 节 ) 。 使 用 方法 是 由 
用 户 反 复 在 “next x” 和 “next y” 框 中 输入 (x, y) 坐标 对 ; 每 输入 一 个 坐标 对 就 点 击 一 次 “next point” 
按钮 。 

开始 时 ,“current(x, y) ” 框 是 空 的 , 程序 等 待 用 户 输入 第 一 个 坐标 对 。 用 户 输入 后 , 起 
点 出 现在 “current( x， y)“ 框 中 ， 每 次 输入 的 新 坐标 都 会 用 来 绘制 一 条 线 : 一 条 从 当前 点 ( 显 
示 在 “current(x, y)” 框 中 的 坐标 ) 到 新 输入 点 (x, y) 之 间 的 线 , 然后 (x, y) 就 成 为 新 的 当 
前 上 总。 

这 样 就 能 够 绘制 一 条 开放 多 线段 , 完成 之 后 用 户 可 以 通过 “quit” 按 钮 退出 。 整 个 过 程 非常 直 
截 了 当 , 同时 该 程序 还 展示 了 几 个 有 用 的 GUI 特性 : 文本 输入 /输出 、 线 的 绘制 和 多 按钮 。 上 面 的 
窗口 显示 了 输入 两 个 坐标 对 之 后 的 结果 ; 输入 7 个 坐标 对 则 可 得 : 





让 我 们 来 定义 一 个 表示 这 种 窗口 的 类 。 代 码 如 下 所 示 , 这 段 代 码 也 很 直接 


struct Lines_window : Window { 
Lines_window(Poinit xy, int w, int h, const string& title ); 
Open_polyline lines; 
private: 
Button next_button; //add (next_x,next_y) to lines 
Button quit_button; 
lin_box next_x; 
jn_box next_y; 
Out_ box xy_out; 


static void cb_next(Address, Address);  // callback for next_button 
void next(); 
static void cb_quit(Address, Address); // callback for quit_button 
void quit(); 

}; 


代码 中 使 用 Open_polyline 对 象 表示 线 。 代 码 还 声明 了 按钮 和 文本 框 (分 别 为 Button、In_box 和 
Out_box) , 并 且 为 每 个 按钮 声明 了 一 个 实现 其 功能 的 成 员 函 数 和 对 应 的 回调 函数 。 
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Line_window 的 构造 函数 负责 初始 化 所 有 成 员 : 


Lines_window::Lines_ window(Point xy, int w, int h, const string& title) 
:Window(xy,w,h,title), 
next_button(Point(x_max()-—-150,0), 70, 20, "Next point", cb_next), 
quit_button(Point(x_max()-70,0), 70, 20, "Quit", cb _ quit)， 
next_x(Point(x_max{()—-310,0), 50, 20, "next x: )， 
next_y(Point(x_max()—210,0), 50, 20, "next y: "), 
xy_out(Point(100,0), 100, 20, "current (x,y): ") 


attach{(next_button); 
attach(quit_button); 
attach(next_x); 
attach(next_y); 
attach(xy_out); 
attach(jines); 


} 
也 就 是 说 , 创建 每 一 个 构件 并 把 它们 添加 到 窗口 中 。 
对 “Quit 按钮 的 处 理 是 比较 简单 的 : 


void Lines_window::cb_ quit(Address, Address pw) ”上 “the usual 
{ 
reference_to<Lines_window>(pw).quit(); 


} 
void Lines_window: :quit() 


hide(); /curious FLTK idiom for delete window 


} 
同 以 往 一 样 : 回调 函数 (这 里 是 cb_quit( ) ) 只 是 跳 转 到 完成 实际 操作 的 函数 (这 里 是 quit( ) ) 。 这 
里 的 实际 操作 是 删除 窗口 (Window) ， 此 处 我 们 使 用 了 FLTK 的 一 个 奇怪 的 特性 一 一 简单 地 隐藏 
窗口 。 

主要 工作 都 在 ”Next point "按钮 中 完成 。 它 的 回调 函数 也 很 普通 : 


void Lines_window::cb_next(Address, Address pw) / “the usual” 


{ 


reference_to<Lines_window>(pw).next(); 


} 
next( ) 因数 定义 了 ”Next point” 按 钮 所 做 的 实际 工作 ; 读 取 一 个 坐标 对 , 更 新 Open_polyline 对 象 ， 
更 新 位 置 的 输出 , 并 且 重 绘 和 窗口 : 


void Lines window::next() 

{ 
int x = next_x.get_int(); 
inty = next_y.get_int(); 


lines.add(Point(x,y)); 


// update current position readout: 
stringstream ss; 

SS << (<<X<< <<y<<1) 7; 
xy_out.put(ss.str()); 


redrawf(); 


} 
这 段 代 码 很 容易 理解 。 我 们 用 get_int( ) 从 In_box 得 到 整数 坐标 值 ; 用 一 个 stringstream 对 象 来 格 
式 化 要 输出 到 Out_box 的 字符 串 ; str( ) 成 员 函 数 负责 从 stringstream 对 象 中 读 取 字 符 串 ; redraw( ) 
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果 数 将 最 终结 果 显 示 给 用 户 。 注 意 , 直到 Window 的 redraw( ) 郴 数 被 调用 之 前 ， 屏 幕 上 一 直 显 示 


的 是 旧 图 像 。 
那么 ,这 个 程序 有 什么 奇怪 和 不 同 之 处 呢 ? 让 我 们 看 看 它 的 main( ) 函数 : 
#include "GUI.h" 
int main() 
try { 


Lines_window win(Point(100,100),600,400, "lines’); 
return gui_main(); 


catch(exception& e) { 
Cerr << "exception; ”<< e.what() << \n'; 
return 1; 


} 

catch (...) { 
cerr << "Some exceptionn'; 
return 2; 


} 
这 里 基本 没有 做 任何 事情 ! main( ) 函数 体 只 是 定义 了 窗口 win 并 调用 函数 gui_main( ) 。 这 里 并 没 
有 其 他 函数 , 没有 任何 在 第 6、7 章 介 绍 过 的 过、switch 或 循环 等 代码 , 仅仅 是 一 个 变量 的 定义 和 对 
函数 gui_main( ) 的 调用 , 而 gui_main( ) 本 身 也 只 是 调用 FLTK 的 run( ) 函数 。 更 进一步 , 我 们 会 发 
现 mun( ) 函数 也 只 是 一 个 简单 的 无 限 循环 : 


while(wait()); 
除了 少数 几 个 将 在 附录 中 介绍 的 实现 细节 外 , 我 们 已 经 看 到 了 令 画 线程 序 运行 起 来 的 所 有 代码 
和 所 有 的 基本 逻辑 。 那 么 ， 前 面 发 现 的 奇怪 问题 到 底 是 怎么 回 事 呢 ? 


16.6 控制 流 的 反 转 


这 里 的 关键 就 是 , 我 们 将 执行 序 的 控制 权 从 程序 交 给 了 构件 : 无 论 用 户 激 活 、 运 行 哪个 构件 ， 
都 会 发 生 这 种 情况 。 例 如 ,点 击 一 个 按钮 就 会 运行 它 的 回调 函数 。 当 回调 晒 数 返回 以 后 , 程序 就 
挂 起 , 等 待 用 户 进行 其 他 处 理 。 本 质 上 ，wait ( ) 告 诉 " 系统" 关注 这 些 构件 并 调用 对 应 的 回调 函 
数 。 理 论 上 ，wait( ) 可 以 告诉 程序 员 哪 个 构件 要 求 这 种 关注 , 并 将 调用 恰当 函数 的 任务 留 给 程序 
员 来 做 。 然 而 , 在 FLTK 和 其 他 大 多 数 GUI 系统 中 , wait( ) 只 是 简单 地 调用 适当 的 回调 枉 数 , 从 而 
免 去 了 程序 员 编 写 相应 代码 的 麻烦 。 


一 个 “常规 程序 ”的 结构 为 : 
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“控制 流 反 转 ” 的 一 个 含义 是 程序 的 执行 顺序 完全 由 用 户 的 行为 决定 。 这 使 得 程序 的 组 织 和 调试 
都 更 加 复杂 。 很 难 猜 想 用 户 想 要 做 什么 ,也 很 难 想 象 一 个 随机 回调 序列 可 能 产生 的 所 有 影响 。 这 
使 得 系统 测试 非常 困难 (参见 第 26 章 ) 。 处 理 这 些 间 题 的 技术 已 经 超出 了 本 书 的 讨论 范围 , 但 是 
我 们 建议 你 要 格外 小 心 那些 由 用 户 通过 回调 来 驱动 的 代码 。 除 了 明显 的 控制 流 问题 之 外 , 还 有 关 
于 可 见 性 的 问题 , 以 及 跟踪 构件 与 数据 关联 的 困难 。 为 了 尽量 减少 腑 烦 , 关键 是 要 保证 GUI 部 分 
的 程序 简洁 性 , 同时 逐步 增 量 式 构建 一 个 GUI 程序 , 并 且 在 每 一 个 阶段 都 要 测试 。 当 你 编写 一 个 
GUI 程序 的 时 候 , 绘制 对 象 及 它们 之 间 交 互 的 图 表 也 是 很 关键 的 。 

被 不 同 回调 函数 触发 的 代码 是 如 何 相互 通信 的 呢 ? 最 简单 的 方法 是 处 理 保 存在 窗口 中 的 数 
据 , 就 像 16. 5 节 中 的 例子 那样 。 在 那个 例子 中 ，Lines_window 的 next( ) 函数 通过 点 击 “ Next point 
按钮 被 调用 , 它 从 In_box 读 取 数据 (next_x 和 next_y)，, 并且 更 新 lines 成 员 变 量 和 Out_box (xy_ 
out) 。 显 然 , 由 回调 调用 的 函数 可 以 做 任何 事情 : 可 以 打开 文件 、 连 接 网 络 等 。 但 是 , 目前 我 们 只 
考虑 简单 的 情况 : 将 数据 保存 在 窗口 中 。 


16.7 添加 菜单 


我 们 下 面 通过 为 画 线程 序 添加 菜单 ,来 进一步 研究 “控制 流 反 转 ” 带 来 的 控制 和 通信 问题 。 首 
先 , 我 们 提供 一 个 简单 的 菜单 ， 允 许 用 户 改 变 lines 成 员 变 量 中 所 有 线 的 颜色 。 下 面 我 们 添加 color_ 
menu 菜单 及 其 回调 肾 数 : 


struct Lines_window : Window { 
Lines_window(Point xy, int w, int h, const string& titie); 


Open_polyline lines; 
Menu color_menu; 


static void cb_red(Address， Address); /cajjiback for red button 
static void cb_blue(Address, Address); /cajiback for blue button 
static void cb_black(Address, Address); //callback for black button 


// the actions: 

void red_pressed( { change(Color::red); } 
void blue_pressed() { change(Color: :blue); } 
void black_pressed() { change(Color::black); } 


void change(Color c) { lines.set_color(c); } 
//...as before... 
}; 
重复 写 出 这 些 几乎 相同 的 回调 函数 和 ”动作 ”函数 非常 乏味 。 但 是 , 这 在 概念 上 比较 简单 , 而 且 那 
些 在 输入 方面 更 加 简单 的 方式 也 超出 了 本 书 的 讨论 范围 。 当 一 个 菜单 按钮 被 按 下 时 , 它 会 将 线 改 
为 所 要 求 的 颜色 。 
我 们 需要 初始 化 已 经 定义 的 color_menu 成 员 : 


Lines_ window::Lines_window(Point xy, int w, int h, const string& titje) 
:Window(xy,w,h,title), 
/i...as before... 
color_menu(Point(x_max()—70,40),70,20, Menu: :vertical, "color") 


//...as before... 
color_menu.attach(new Button(Point(0,0),0,0,"red" ,cb_red)); 
color_menu. attach(new Button(Point(0,0),0,0,*blue' cb_blue)); 
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color_menu, attach(new Button(Point(0,0),0,0,"black" ,cb_black)); 
attach(color_menu); 


} 
这 些 按钮 是 动态 添加 到 菜单 上 的 (使 用 attach( ) ), 并 且 可 以 根据 需要 移 除 和 替换 它们 。Menu :: attach( ) 
调整 按钮 的 尺寸 和 位 置 , 并 将 它们 添加 到 窗口 中 。 这 就 是 这 有 段 代码 的 全 部 工作 , 其 运行 结果 
如 下 : 
程序 运行 了 一 段 时 间 之 后 , 我 们 发 现 真 正 需 要 的 是 一 个 “弹出 式 ” 菜 单 ; 也 就 是 说 , 我 们 不 希望 把 
稀有 的 屏幕 空间 用 在 一 个 菜单 上 , 除非 我 们 正在 使 用 它 。 因 此 , 我 们 添加 一 个 “color menu” 按 钮 。 
当 按 下 它 的 时 候 , 弹出 颜色 菜单 , 并 且 在 完成 一 个 选择 操作 之 后 , 菜单 重新 隐藏 起 来 ,而 “color 
menu ”按钮 再 次 出 现在 窗口 中 。 

添加 了 几 条 线 之 后 的 窗口 如 下 : 





我 们 看 到 了 新 的 “color menu ”按钮 和 一 些 ( 黑 色 的 ) 线 。 点 击 “color menu” 按钮 会 出 现 颜色 菜单 : 


注意 ,这 时 候 “color menu "按钮 隐藏 了 , 在 使 用 颜色 菜单 完成 操作 之 前 并 不 需要 这 个 按钮 。 点 击 
“blue ”按钮 后 可 得 : 


:和 
a 





现在 , 线 都 变 成 了 蓝 色 并 且 “color menu” 按 钮 重新 出 现在 窗口 中 。 


为 了 达到 这 种 效果 ,我 们 添加 了 “color menu” 按钮 并 且 修 改 那些 “点 击 ” 函数 来 调整 菜单 和 近 
钮 的 可 见 性 。 下 面 是 Lines_window 的 完整 实现 : 


struct Lines_window : Window { 

Lines_window(Point xy, int w, int h, const string& titie ); 
private: 

/ data: 


Open_polyiine lines; 


// widgets: 
Button next_button; //add (next_x,next_y) to fines 
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Button quit_button; //end program 
In_box next x; 

In_box next_y; 

Out_box xy_out; 

Menu color_menu; 

Button menu_button; 

void change(Color c) { lines.set_color(c); } 


void hide_menu() { color_menu.hide(}); menu_button.show(); } 

1 actions invoked by callbacks: 

void red_pressed0 { change(Color: :red); hide_menu!(); } 

void blue_pressed() { change(Color::blue); hide_menu(); } 

void black_pressed() { change(Color: :black); hide_menu(); } 

void menu_pressed() { menu_button.hide(); color_menu.show!(); } 
void next(); 

void quit(); 


I callback functions: 
static void ch_red(Address, Address); 
static void ch_blue(Address, Address); 
static void cb_black(Address, Address); 
static void cb_menu(Address, Address); 
static void ch_next(Address, Address); 
static void ch_quit(Address, Address); 
}; 


注意 , 除了 构造 函数 以 外 , 其 他 成 员 都 是 私有 的 。 本 质 上 , 这 个 窗口 类 就 是 完整 程序 。 所 有 工作 
都 是 通过 它 的 回调 函数 完成 的 , 因此 不 需要 窗口 之 外 的 任何 代码 。 我 们 将 声明 进行 了 简单 排列 ， 
以 使 类 更 可 读 。 构 造 函 数 提供 了 所 有 子 对 象 的 参数 并 将 这 些 对 象 添 加 到 窗口 中 : 


Lines_window::Lines_window(Point xy int w int h, const string& title) 
:Window(xy,w,h,title), 
next_button(Point(x_max()—150,0), 70, 20, "Next point", cb_next), 
quit_button(Point(x_max()—70,0), 70, 20, "Quit", cb_quit), 
next_x(Point(x_max()-310,0), 50, 20, "next x:"), 
next_y(Point(x_max()-—210,0), 50, 20, "next y:"), 
xy_out(Point(100,0), 100, 20, "current (x,y):") 
color_menu(Point(x_max()-—70,30),70,20,Menu: :vertical near 
menuyu_button(Point(x_max()-80,30), 80, 20, "color menu" ch_menu), 


attach(next_button); 
attach(quit_button); 
attach(next_x); 
attach(next_y); 
attach(xy_out); 
xy_out.put("no point"); 
color_ menu,attach(new Button(Point(0,0),0,0,"red" ,ch_red)); 
color_menu. attach(new Button(Point(0,0),0,0,"blue",cb_blue)); 
color_menu,. attach(new Button(Point(0,0),0,0,"black",cb_black)); 
attach(color_menu); 
color_menu,.hide(); 
attach(menu_button); 
attach(lines); 
} 


注意 , 初始 化 的 顺序 和 数据 成 员 的 声明 顺序 是 一 致 的 , 这 是 书写 初始 化 代码 的 正确 顺序 。 事 实 
上 ，, 成 员 初 始 化 的 执行 顺序 总 是 按照 成 员 声 明 的 顺序 。 如 果 一 个 基 类 或 成 员 的 构造 函数 的 次 序 不 
对 , 一 些 编译 器 会 给 出 警告 信息 。 
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16.8 调试 GUI 代码 


一 旦 GUI 程序 开始 工作 , 通常 就 很 容易 调试 了 :; 因为 你 看 到 的 就 是 你 得 到 的 。 然 而 , 在 第 一 
个 形状 和 构件 开始 出 现在 窗口 中 ， 甚至 是 窗口 出 现在 屏幕 上 之 前 ， 通常 会 是 一 个 充满 挫折 的 阶 
段 。 试 试 下 面 的 main( ) 函数 : 


int main() 

{ 
Lines_window (Point(100,100),600,400, "lines’); 
return gui_main(); 


} 


你 看 到 错误 了 吗 ? 无 论 你 是 否 看 到 了 , 你 都 应 该 试 一 试 ; 程序 可 以 编译 通过 并 运行 , 但 是 Lines_ 
window 并 未 给 你 画 线 的 机 会 , 你 能 得 到 的 最 多 是 屏幕 上 的 一 内 而 已 。 如 何 从 这 样 的 程序 中 找到 错 
误 呢 ? 

。 小 心 使 用 经 过 严格 验证 的 程序 组 件 (类 、 函 数 、 库 )。 

。 简化 所 有 的 新 代码 ， 降低 程序 从 最 简 版 本 “增长 " 的 速度 ， 仔 绍 逐 行 检查 代码 。 
检查 所 有 的 链接 设置 。 
。 与 已 经 正常 运行 的 程序 比较 。 
问 朋友 解释 代码 。 
你 会 发 现 很 难 跟踪 代码 的 执行 过 程 。 如 果 你 已 经 学 会 了 使 用 调试 器 ,你 可 能 还 有 机 会 , 但 在 这 种 
情况 下 ， 只 是 加 入 “输出 语句 将 不 再 有 效 一 -因为 根本 看 不 到 任何 输 出 。 即 使 是 使 用 调试 器 也 有 


> 

















pond oie ty 
那么 前 面 main( ) 函数 的 问题 出 在 哪儿 呢 ? 下 面 给 出 了 正确 的 版 本 (来 和 16.5 节 ) : 


int main() 
{ 
Lines_window MT en me 
return gui_main(); | | 
} 


我 们 “忘记 ”了 Lines_window 的 名 字 win。 因 为 我 们 实际 上 并 不 需要 这 个 名 字 , 这 看 起 来 是 合理 的 ， 
但 是 编译 器 会 认为 既然 我 们 不 再 使 用 这 个 窗口 , 那 就 要 立即 销毁 它 。 天 啊 ! 这 个 窗口 的 生命 期 仅 
仅 是 毫秒 级 , 这 样 出 现 前 面 的 结果 就 不 足 为 奇 了 。 

另 一 个 常见 的 问题 是 将 一 个 窗口 恰好 放 在 了 另 一 个 窗口 上 面 , 明显 (或 者 不 是 非常 明显 ) 看 起 
来 就 像 只 有 一 个 窗口 。 另 一 个 窗口 到 哪儿 去 了 呢 ? 我 们 很 可 能 会 寻找 这 种 代码 中 并 不 存在 的 错 
误 , 而 浪费 宝贵 的 时 间 。 如 果 我 们 把 一 个 形状 放 在 了 另 一 个 形状 上 面 ， 人 
问题 。 

还 有 , 可 能 会 让 事情 更 糟 的 是 ， 当 使 用 GUI 库 的 时 候 , 异常 并 不 总 是 如 我 们 希望 的 那样 正 
常 工作 。 因 为 代码 由 GUI 库 控 制 , 我 们 抛 出 的 异常 可 能 永远 不 会 到 达 我 们 的 处 理 程序 ，GUI 库 
或 者 操作 系统 可 能 会 “ 吃 掉 ” 它 ( 即 它们 可 能 依赖 不 同 于 C++ 异常 的 错误 处 理 机 制 , 可 能 完全 
忽略 了 C++)。 

在 调试 中 经 常 发 现 的 间 题 包括 ， 由 于 abe 和 Widget 对 象 没有 被 添加 到 窗口 中 而 没有 显示 ; 
由 于 超出 对 象 的 作用 域 导 致 出 错 。 考 虑 程序 员 如 何在 菜单 中 创建 并 添加 按钮 : 
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// helper function for loading buttons into a menu 
void load_disaster_menu(Menu& mm 


{ 
Point orig(0,0); 
Button bi(orig,0,0, "flood" cb _ flood); 
Button b2(orig,0,0, "fire",cb_fire); 
Ms 
mattach(b1); 
m.attachtb2); 
// . .， 
} 
int main() 
‘ 
人 
Menu disasters(Point(100,100),60,20,Menu::horizontal "disasters")， 
load_disaster_ menu(disasters)， 
win.attach(disasters); 
Ms 
} 


上 面 的 代码 不 能 正常 运行 。 所 有 按钮 都 是 load_disaster_menu( ) 函数 内 的 局 部 变量 , 将 它们 添 
加 到 菜单 上 并 不 会 改变 这 一 点 。 在 18. 5.4 节 中 可 以 找到 这 一 问题 的 解释 (不 要 返回 指向 局 部 
变量 的 指针 ) ,而 8. 5. 8 节 说 明了 局 部 变量 的 内 存 布局 情况 。 这 里 的 关键 是 , 在 load_disaster_ 
menu( ) 函数 返回 之 后 , 那些 局 部 对 象 就 已 经 被 销毁 了 ，disasters 菜单 将 指向 不 存在 (销毁 了 ) 的 
对 象 。 结 果 肯 定 是 错误 的 并 且 令 人 吃惊 的 。 解 决 方法 是 使 用 new 创建 的 未 命名 对 象 而 不 是 命 
名 的 局 部 对 象 : z : 


// helper function for loading buttons into a menu 
void load_disaster_menu(Menu& m) 
‘ 
Point orig(0,0); 
m.attach(new Button(orig,0,0, "flood" ,cb_flood)); 
m.attach(new Button(orig,0,0, "fire’ ,cb_ fire)); 
1. 
} 


正确 方法 甚至 比 (十 分 常见 的 ) 错 误 方法 更 加 简单 。 
人 》 简单 练习 


1. 使 用 FLTK 的 链接 程序 设置 (如 附录 D 中 的 描述 ) 并 建立 一 个 新 项 目 。 
2. 使 用 Graph_lib 的 工具 , 输入 16.5 节 的 画 线 程序 并 运行 它 。 
3. 使 用 16. 7 节 中 描述 的 那 种 “弹出 式 "菜单 修改 程序 并 运行 它 。 
4. 再 次 修改 这 个 程序 , 添加 第 二 个 菜单 用 于 选择 线 型 ,并 运行 它 。 
全 》 思 考题 

. 为 什么 需要 图 形 用 户 界面 7 

. 什么 时 候 需 要 非 图 形 用 户 界 面 ? 

. 什么 是 软件 的 层次 结构 ? 

.为 什么 需要 对 软件 分 层 ? 

C++ 程序 与 操作 系统 通信 时 的 基本 问题 是 什么 ? ， 

. 什么 是 回调 函数 ? 

.什么 是 构件 ? 


ee 
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8. 
9. 


构件 的 男 一 个 名 称 是 什么 ? 
首 字母 缩写 词 FLTK 是 什么 意思 ? 


.FLTK 如 何 发 音 ? 

.你 还 听 说 过 其 他 的 GUI 工具 集 吗 ? 

.哪些 系统 使 用 术语 构件 ?哪些 系统 更 育 欢 使 用 控件 一 词 ? 
. 构件 的 例子 有 哪些 ? 

.什么 时 候 需 要 使 用 输入 框 ? 

: 输入 框 中 的 值 是 什么 类 型 的 ? 

. 什么 时 候 需 要 使 用 按钮 ? 

. 什么 时 候 需 要 使 用 荣 单 ? 

. 什么 是 控制 流 反 转 ? 

. 调试 GUI 程序 的 基本 策略 是 什么 ? 

0. 为 什么 调试 GUI 程序 比 调试 “普通 的 流 式 输 入 /输出 程序 ”更 难 ? 


人 


按钮 对 话 框 可 见 / 隐 茂 回调 GUI 等 得 输入 
控制 台 VO 菜单 等 符 循 环 控制 流 软件 层次 构件 
控制 流 反 转 用 户 接口 


人 》 刁 题 


1. 创建 一 个 My_window 类 , 它 比 Simple_window 多 两 个 按钮 
.创建 一 个 带 有 4 x4 的 正方 形 按钮 方 阵 的 窗口 (基于 My_window) 。 当 按 下 按钮 时 执行 一 个 简单 的 动作 , 比 


8. 


9. 


10. 





next 和 quit。 


如 在 一 个 输出 框 中 打印 它 的 坐标 , 或 者 变换 为 一 个 稍微 不 同 的 颜色 ( 直到 按 下 为 一 个 按钮 ) 。 


. 在 按钮 (Button) 上 放置 一 个 图 像 (Image) ， 当 按 下 按钮 时 移动 按钮 和 图 像 。 使 用 下 面 的 随机 数 发 生 器 为 


“图 像 按 钮 选择 新 位 置 : 
int rint(int low, int high) { return Jow+rand (2%(high-low); } 
它 返 回 一 个 [low, high) 内 的 随机 整数 。 


. 创建 一 个 菜单 , 包括 绘制 圆 、 正 方形 、 等 边 三 角形 、 六 边 形 等 菜单 项 。 创 建 一 个 (或 两 个 ) 输 人 框 用 


于 输入 坐标 对 , 将 点 击 某 个 菜单 项 后 绘制 的 形状 放置 在 这 个 坐标 指定 的 位 置 上 。 抱 菊 ， 没有 拖 放 
功能 。 


. 编写 程序 绘制 一 个 你 选择 的 形状 , 并 在 每 次 点 击 “ Next" 时 将 其 移动 到 一 个 新 的 位 置 。 这 个 新 位 置 根据 从 


输入 流 读 取 的 一 个 坐标 对 决定 。 


.编写 一 个 “模拟 时 钟 ”， 即 一 个 带 有 转动 指针 的 时 钟 。 通 过 一 个 库 函 数 调用 从 操作 系统 获取 时 间 值 。 这 个 


练习 的 主要 工作 是 找到 能 够 获取 时 间 的 函数 ,找到 等 待 一 小 段 时 间 ( 比如, 1 秒 ) 的 方法 , 以 及 根据 你 找 
到 的 文档 学 会 使 用 它们 。 提 示 : 可 考虑 使 用 clock( ) 、sleep( ) 晴 数 。 


:. 使 用 前 面 练习 中 的 技术 , 创建 一 个 飞机 图 像 并 让 它 在 窗口 中 “ 飞 来 飞 去 ”。 窗口 有 一 个 start” 按钮 和 一 个 


“stop” 按 钮 。 

编写 一 个 货币 换算 器 。 在 启动 时 从 一 个 文件 读 取 汇率 。 在 输入 窗口 中 输入 数额 ,然后 提供 一 种 选择 需 换 
算 的 两 种 货币 类 型 的 方式 (例如 , 使 用 两 个 菜单 ) 。 
修改 第 7 章 的 计算 器 程序 , 令 它 从 输入 框 获取 输入 , 并 将 结果 返回 到 输出 框 。 

编写 一 个 程序 , 可 以 让 用 户 从 一 组 数学 函数 (例如 sin( ) 和 log( ) ) 中 进行 选择 , 并 为 这 些 函 数 提供 参数 ， 
然后 将 它们 图 形 化 显示 出 来 。 


忆 》 附 计 


GUI 是 一 个 庞大 的 主题 , 它 的 很 多 内 容 与 已 有 系统 的 风格 和 兼容 性 有 关 , 而 且 必 须 处 理 种 类 过 于 繁多 的 


构件 (例如 GUI 库 提供 许多 不 同 的 按钮 风格 ) , 可 能 植物 学 家 对 此 会 感到 更 亲切 些 。 然 而 , 其 中 只 有 很 少 一 
部 分 与 重要 的 程序 设计 技术 有 关 ， 所 以 我 们 不 需要 在 这 方面 进行 研究 。 其 他 的 主题 如 按 比 例 缩放 、 旋 转 、 变 
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形 、 三 维 对 象 、 阴 影 等 , 涉及 很 多 图 形 学 和 数学 方面 的 话题 我 们 在 本 章 中 并 未 讨论 。 

你 必须 要 知道 的 一 件 事情 是 , 多 数 GUI 系统 都 提供 了 一 个 “GUI 程序 生成 工具 ”, 你 可 以 在 图 形 方 式 下 
设计 你 的 窗口 布局 , 将 回调 和 动作 函数 与 按钮 、 菜 单 等 关联 起 来 。 对 许多 应 用 程序 来 说 , 这 样 一 个 GUI 生成 
工具 有 助 于 减少 那些 编写 “框架 式 代码 ”( 例 如 我 们 的 回调 函数 ) 的 乏味 工作 。 然 而 , 我 们 应 该 尝试 理解 程序 
是 如 何 运 行 的 。 有 时, 这 类 工具 生成 的 代码 与 你 本 章 中 看 到 的 代码 相同 。 有 时 , 这 类 代码 可 能 会 使 用 一 些 
更 加 精致 和 /或 代价 更 高 的 机 制 。 
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第 17 章 ” 同 量 和 自由 空间 


“默认 使 用 向 量 !” 





Alex Stepanoy 


本 章 和 后 面 四 章 将 介绍 C++ 标 准 库 ( 通 常 称 为 STL) 的 容器 和 算法 部 分 。 我 们 介绍 STL 的 关 
键 功能 和 一 些 用 途 。 另 外 , 我 们 介绍 用 于 实现 STL 的 关键 设计 和 编程 技术 ,以 及 它 的 一 些 低层 语 
言 特点 。 它 们 主要 是 指针 、 数组 和 自由 空间 。 本 章 和 后 面 两 章 的 重点 是 最 通用 和 最 有 用 的 STL 容 
器 : 向 量 的 设计 和 实现 。 


17.1 介绍 


C++ 标准 库 中 最 有 用 的 容器 是 向 量 。 一 个 向 量 提供 一 系列 指定 类 型 的 元 素 。 你 可 以 通过 它 
的 索引 (下 标 ) 找到 一 个 元 素 , 使 用 push_back( ) 来 扩展 向 量 , 使 用 size( ) 来 获得 一 个 向 量 中 的 元 
素数 量 , 以 及 防止 对 超出 范围 的 向 量 元 素 的 访问 。 标 准 库 向 量 是 一 个 方便 的 、 灵 活 的 有 效 的 (在 
时 间 和 空间 上 ) 、 静态 的 、 类 型 安全 的 元 素 容 器 。 标 准 字符 串 具 有 相似 的 属性 , 另外 还 有 其 他 有 用 
的 容器 类 型 ,例如 列表 和 映射 我们 将 在 第 20 章 中 介绍 。 但 是 , 一 台 计算 机 的 内 存 并 不 能 直接 支 
持 这 些 有 用 的 类 型 。 硬 件 直 接 支持 的 只 是 字 节 序列 。 例 如 ,对 于 一 个 vector < double > , 操作 
v push_back(2.3) 将 2.3 添加 到 double 类 型 序列 中 , 并 将 元 素数 量 v(v. size( ) ) 增 加 1。 在 最 低 的 
层次 中 , 计算 机 并 不 知道 任何 像 push_back( ) 那样 复杂 的 事情 ; 它 所 知道 的 只 是 如 何 一 次 读 或 写 
多 个 字 节 。 

在 本 章 和 后 面 两 章 中 , 我们 将 展示 如 何 通 过 基本 语言 功能 来 创建 向 量 , 这 对 于 每 个 程序 员 都 
是 有 用 的 。 这 样 , 我 们 可 以 说 明 这 些 有 用 的 概念 和 编程 技术 , 而 且 还 可 以 通过 C++ 语言 的 特点 来 
把 它们 表示 出 来 。 我 们 在 向 量 的 实现 中 过 到 的 语言 功能 和 编程 技术 , 通常 是 有 用 的 和 被 广泛 使 
用 的 。 

在 学 习 如 何 设计 、 实现 和 使 用 向 量 之 后 , 我 们 可 以 开始 研究 其 他 的 标准 库容 器 (例如 映射) ， 
并 测试 C++ 标准 库 所 提供 的 简洁 的 、 有 效 的 功能 (参见 第 20 和 21 章 ) 。 这 些 功能 称 为 算法 , 它 可 
以 使 我 们 从 涉及 数据 的 一 般 任务 中 解脱 出 来 。 实 际 上 , 每 一 个 C++ 的 实现 都 提供 了 许多 算法 为 
我 们 使 用 , 这 可 以 大 大 简化 编写 和 测试 我 们 自己 的 库 的 工作 。 我 们 曾经 看 过 和 使 用 过 标准 库 中 的 
一 个 最 有 用 的 算法 : sort( ) 。 
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我 们 通过 一 系列 越 来 越 复 杂 的 向 量 实现 来 了 解 标 准 库 。 首 先 , 我 们 创建 一 个 非常 简单 的 向 
量 。 然 后 , 我 们 看 向 量 不 希望 得 到 什么 并 修改 它 。 这 样 反复 几 次 之 后 , 我 们 得 到 一 个 与 标准 库 向 
量 大 致 相当 的 向 量 , 也 就 是 你 的 C++ 编译 器 所 带 的 库 , 在 前 面 章 节 中 已 经 使 用 过 。 这 种 逐渐 完善 
”的 过 程 与 我 们 接触 一 个 新 的 编程 任务 的 方式 非常 相似 。 在 此 过 程 中 ， 我 们 会 遇 到 和 讨论 涉及 内 在 
和 数据 结构 使 用 的 很 多 经 典 问题 。 基 本 计划 是 ; 

。 第 17 章 (本 章 ) : 如 何 处 理 大 小 不 同 的 内 存 ? 特别 地 ， 不 同 向 量 如 何 拥有 不 同 数量 的 元 素 ， 

一 个 向 量 如 何在 不 同时 间 拥 有 不 同 数量 的 元 素 ? 这 促使 我 们 使 用 自由 空间 ( 堆 空 间 ) 、 指 
针 、 转 换 ( 显 式 的 类 型 转换 ) 和 引用 。 
。 第 18 章 : 如 何 复制 向 量 ? 如 何 为 它们 提供 下 标 操作 ? 我 们 也 会 介绍 数组 , 并 讨论 它 与 指 
针 的 关系 。 
e 第 19 章 ; 如 何 使 向 量具 有 不 同 的 元 素 类 型 ? 如 何 处 理 越界 错误 ? 为 了 回答 这 个 问题 ,我 
们 将 讨论 C++ 模 板 和 异常 处 理 功 能 。 
除了 在 实现 灵活 的 、 有 效 的 、 类 型 安全 的 向 量 时 介绍 新 的 语言 功能 和 技术 之 外 , 我 们 也 将 会 使 用 
我 们 曾经 提 到 过 的 语言 功能 和 编程 技术 。 侦 尔 , 我们 也 有 机 会 给 出 一 些 更 加 正式 和 技术 上 的 
定义 。 

好 了 , 现在 是 我 们 开始 直接 处 理 内 存 的 时 候 了 。 为 什么 我 们 要 这 样 做 ? 向 量 和 字符 串 是 非常 
有 用 和 方便 的 , 我 们 可 以 仅仅 使 用 它们 。 毕 况 , 这 些 容器 (例如 向 量 和 字符 串 ) 设 计 目的 之 一 就 是 
将 我 们 与 实际 处 理 内 存 时 的 某 些 不 愉快 因素 隔离 。 但 是 , 除非 相信 魔法 ,否则 我 们 必须 进行 最 低 
层次 的 内 存 管理 。 为 什么 你 不 能 “只 相信 和 魔法”? (或 者 对 它 抱 一 个 更 积极 的 态度 ) 为 什么 你 不 能 
“相信 向 量 的 实现 者 知道 他 们 在 做 什么 ”? 毕竟 , 我 们 不 建议 你 了 解 使 计算 机 的 内 存 运转 起 来 的 物 
理 设 备 。 E 

原因 是 , 我 们 是 程序 员 ( 计算 机 科学 家 、 软 件 开发 者 或 其 他 人 员 ) 而 不 是 物理 学 家 。 如 果 我 们 正 
在 学 习 器 件 物理 学 , 我 们 可 能 会 要 查看 计算 机 内 存 的 设计 细节 。 但 是 , 既然 我 们 正在 学 习 程 序 设计 ， 
就 必须 深入 程序 设计 的 细节 。 从 理论 上 来 说 , 我 们 可 以 像 对 库 物 理 设备 那样 来 看 待 低层 次 的 内 存 访 
问 和 管理 功能 的 “实现 细节 ”。 但 是 , 如 果 我 们 那样 去 做 , 你 将 不 能 只 是 “相信 魔法 ”; 你 将 不 能 实现 

一 个 新 的 容器 (会 有 这 种 需求 的 , 这 不 罕见 ) 。 另 外 , 你 将 不 能 阅读 大 量 的 直接 使 用 内 存 的 C 与 C++ 
代码 。 当 我 们 阅读 后 面 几 章 时 , 指针 (一 种 低层 次 的 、 直 接 指向 一 个 对 象 的 方式 ) 对 很 多 与 内 存 管理 
无 关 的 问题 也 是 有 用 的 。 在 不 使 用 指针 的 情况 下 , 使 用 好 C++ 并 不 是 容易 的 事 。 

更 有 哲理 的 是 , 我 和 很 多 计算 机 专业 人 士 持 同样 的 观点 , 如果 你 对 一 个 程序 如 何 映射 到 计算 
机 内 存 和 操作 缺乏 基本 和 实际 的 理解 , 你 将 会 在 把 握 高 层次 的 主题 时 遇 到 问题 ,例如 数据 结构 、 
算法 和 操作 系统 。 


17.2 向量 的 基本 知识 
我 们 开始 对 向 量 的 循序 渐进 的 设计 , 考虑 一 个 非常 简单 的 用 途 : 


vector<double> age(4); //a vector with 4 elements of type double 
age[0]=0.33; : 

age[1]=22.0; 

age[2]=27.2; 

agel3]=54.2; 


很 明显 ， 我 们 创建 一 个 有 四 个 double 类 型 元 素 的 回 量 ， 并 且 给 这 四 个 元 素 分 别 赋值 为 0 33、22. 0、 
27. 2 和 54.2。 将 这 四 个 元 素 编号 为 0、1、2 和 3。 对 C++ 标准 库容 器 中 的 元 素 编号 只 能 从 0 开 
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始 。 从 0 开始 编号 是 很 常用 的 ， 它 是 C++ 程序 员 之 间 的 普遍 约定 。 一 个 向 量 中 的 元 素数 量 称 为 
它 的 大 小 。 因 此 ，age 的 大 小 为 4。 一 个 向 量 中 的 元 素 被 编号 (索引 ) 为 0 到 size -1。 例 如， age 中 
的 元 素 被 编号 为 0 到 age. size( ) - 1。 我 们 可 以 用 右 sse 
图 来 表示 age。 如 何 将 这 种 “图 形 化 设计 ”用 于 实际 国生 生硬: 
的 计算 机 内 存 中 ? 如 何 获得 像 这 样 存储 和 访问 的 
值 ? 很 明显 , 我 们 需要 定义 一 个 类 , 并 且 将 这 个 类 
称 为 vector。 男 外 , 它 需 要 一 个 数据 成 员 保 存 它 的 大 小 , 以 及 男 一 个 数据 成 员 保存 它 的 元 素 。 但 
是 , 我 们 如 何 来 表示 一 组 数量 可 以 变化 的 元 素 ? 可 以 使 用 一 个 标准 库 向 量 , 但 是 (按照 上 下 文 ) 可 
能 会 被 欺骗 : 因为 我 们 是 要 创建 向 量 。 

因此 , 我 们 如 何 表示 上 图 中 的 箭头 ? 考虑 如 何不 使 用 它 来 工作 。 我 们 可 以 定义 一 个 固定 大 小 
的 数据 结构 : 


class vector { 
int size, age0, age1, age2, age3; 
We age: 
}; size: aBe ee 


忽略 符号 方面 的 细节 , 我 们 将 得 到 右 图 。 这 个 过 程 是 简单 和 方 。 辣 全 人 和 生生 A z 

便 的 , 但 是 我 们 第 一 次 用 push_ back( ) 试 图 添加 一 个 元 素 时 就 遇 到 了 这 样 的 问题 ， 我 们 无 法 增加 
一 个 元 素 , 程序 中 的 元 素数 量 固定 为 4 个 。 如 果 我 们 将 向 量 定义 为 元 素数 量 固定 , 那么 改变 元 素 

数量 的 操作 (例如 push_back( ) ) 就 不 能 实现 。 基 本 上 , 我 们 需要 一 个 数据 成 员 来 指向 一 组 元 素 ， 

这 样 当 我 们 需要 更 大 空间 时 可 以 使 它 指向 不 同 组 的 元 素 。 我 们 需要 像 第 一 个 元 素 的 内 存 地 址 这 

样 的 内 容 。 在 C++ 中 , 一 种 可 以 保存 地 址 的 数据 类 型 称 为 指针 ,， 它 在 语法 上 使 用 后 缀 “来 区 分 ， 

因此 double” 是 指 “ 指 向 double 的 指针 ”。 鉴 于 此 ， 人 vector 类 : 


// a very simplified vector of doubles (like vector<doubie>) 
class vector { 








int sz; ~ // the size 
double* elem; // pointer to the first element (of'type double) 
public: 


vector(int s);  // constructor: allocate s doubles, 
// let elem point:to them 
lf store s in sz 
int size( const { return sz; } / the current size 


}; 
在 我 们 进行 向 量 的 设计 之 前 , 我 们 首先 详细 学 习 “ 指 针 ” 的 概念 。 。“ 指 针 ” 和 与 它 紧密 相关 的 “ 数 
组 ”的 概念 , 都 是 C++ 中 的 内存” 概念 的 关键 部 分 。 


17.3 内 存 、 地 址 和 指针 


一 台 计 算 机 的 内 存 是 一 个 字 节 的 序列 。 我 们 可 以 将 这 些 字 节 从 0 到 最 后 一 个 编号 。 我 们 将 这 种 
“一 个 指出 在 内 存 中 位 置 的 数字 " 称 为 地 址 。 我 们 可 以 将 一 个 地 址 看 做 是 一 种 整数 值 。 内 存 中 第 一 个 
字 节 的 地 址 为 0, 下 一 个 字 节 的 地 址 为 1， 以 此 类 推 。 我 们 可 以 将 1M 字 节 可 视 化 为 以 下 图 形 ; 





Ne rh ke RE ee PR i eT he a ee 
和 


我 们 在 内 存 中 保存 的 任何 东西 都 有 一 个 地 址 。 例 如 : 


int var = 17; 
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我 们 将 为 var 分 配 一 段 “int 大 小 "的 内 存 , 并 将 值 17 保存 到 这 段 内存 中 。 我 们 也 可 以 保存 和 操作 
地 址 。 一 个 保存 地 址 的 对 象 称 为 指针 。 例 如 , 用 于 保存 一 个 int 的 地 址 类 型 称 为 一 个 “指向 int 的 
指针 ”或 “int 指针 ”, 并 且 它 的 表示 方法 为 int : 
int* ptr = &var; / ptr holds the address of var 
“地 址 "操作 符 & 用 于 获得 一 个 对 象 的 地 址 。 因 此 ， 全 var 碰巧 开始 于 地 址 4096( 或 22) ,ptr 将 
会 保存 人 4090 : 





基本 上 ， 我 们 将 计算 机 内 存 看 做 是 一 个 字 节 的 序列 ， 它们 被 编号 为 从 0 到 内 存 大 小 减 1。 对 于 有 
些 计算 机 , 这 是 一 个 简化 模型 , 但 是 作为 一 种 初级 的 编程 模型 , 这 已 经 足够 了 。 
每 种 类 型 都 有 对 应 的 指针 类 型 。 例 如 ， 


char ch = 'c'; 


char* pc = &ch; / pointer to char 
int ii = 17; 
int* pi = &ii; H pointer to int 


如 果 我 们 想 看 到 指针 指向 的 对 象 值 ， 我 们 可 以 使 用 “内 容 ”操作 符 ”, 例如 : 


cout << "pc==" << pc << "; contents of pc==" << *pc << "\n'; 
cout << "pi==" << pi << "; contents of pi==" << *pi << "\n'; 


“pc 的 输出 将 是 字符 ce, 而 "pi 的 输出 将 是 整数 17。pc 和 pi 的 输出 依赖 于 编译 器 在 内 存 中 分 配给 
变量 ch 入 的 地 址 。 指 针 值 (地 址 ) 的 表示 方法 也 可 能 依赖 于 你 的 系统 遵守 的 规范 ; 十 六 进 制 表 
示 法 (参见 附录 A. 2. 1. 1) 常 用 于 指针 值 。 

操作 符 的 内 容 (经 常 称 为 解 引用 ( dereference) 操作 符 ) 也 可 以 用 于 赋值 操作 的 左 侧 : 


*pc='x2 /OK: you can assign 'x' to the char pointed to by pc 
*pi = 27; // OK: an int* points to an int so *pi is an int 
*pi=*pc;  //OK: you can assign a char (pc) to:an int (pi) . 


需要 注意 的 是 , 即使 指针 的 值 可 以 被 打印 为 一 个 整数 ， 但 是 指针 并 不 是 一 个 整数 。* 一 个 int 指向 
WA DH int es 而 指针 会 这 样 做 。 指针 类 型 提供 适当 的 地 址 操作 ， 


int i = pi; Herror: can’t assign an int* to an int 
pi= 2 H error: can'tassign an int to an int* | 


与 此 类 似 , 一 个 指向 char 的 指针 (char” ) 不 是 一 个 指向 int 的 指针 (int* ) 。 例 如 ， 


pc= pi; // error: can't assign an int* to a char* 

pi = pc; // error: can't assign a char* to an int* 
为 什么 将 pc 赋值 给 pi 会 出 现 错误 ? 考虑 一 个 答案 : 一 个 char 通常 比 一 个 int 更 小 , 因此 我 们 可 以 
这 样 考虑 : 让 


char ch1 = 'a'; 
char ch2 = 'b'; 
char ch3 = 'c'; 
char ch4 = 'd'; 
int* pi = &ch3; ”ypointto ch,a charsized piece of memory 


// error: we cannot assign a char* to an int* 
// but let's pretend we could 
*pi = 12345; /write to an int-sized piece of memory 
*pi = 67890; 
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编译 器 如 何在 内 存 中 分 配 变 量 是 由 实现 定义 的 , 但 是 我 们 很 可 能 见 到 像 下 图 这 样 的 分 配 情况 。 现 
在 ,如果 编 译 器 对 这 段 代码 没有 异议 , 我 们 可 以 将 12345 写 和 人， 
从 &ch3 开始 的 内 存 。 这 个 过 程 可 能 会 改变 相 邻 内 存 的 值 , 例如 
ch2 或 ch4。 如 果 我 们 确实 不 幸运 (很 容易 发 生 ) , 我 们 将 会 覆盖 


pi 本 身 的 部 分 ! 在 那 种 情况 下 , 下 次 赋值 pi = 67890 会 将 67890 放 和 人 内存 中 完全 不 同 的 部 分 。 
人 高 兴 的 是 这 种 赋值 是 不 允许 的 , 这 是 编译 器 为 低层 次 编程 提供 的 少数 几 种 保护 功能 。 

在 不 太 可 能 出 现 的 情况 下 , 可 能 你 需要 把 一 个 int 转换 成 一 个 指针 ， 或 者 将 一 个 指针 类 型 转 
换 成 其 他 类 型 , 你 将 需要 使 用 reinerpret_cast, 参见 17. 8 节 。 

我 们 在 这 里 确实 需要 接近 硬件 。 这 对 于 一 个 程序 员 来 说 , 并 不 是 一 个 特别 舒服 的 地 方 。 我 们 
只 有 很 少 几 种 可 用 的 原始 操作 , 并且 几乎 不 能 得 到 语言 或 标准 库 的 支持 。 但 是 , 我 们 不 得 不 了 解 
高 层 功能 (例如 向 量 ) 如 何 实现 。 我 们 需要 理解 如 何在 这 个 层次 编写 代码 , 这 是 由 于 并 不 是 所 有 代 
码 位 于 “高 层 ”( 见 第 25 章 ) 。 同 样 , 我 们 更 欣赏 软件 高 层 的 方便 和 相对 的 安全 ,实际 上 我 们 已 经 
体验 过 缺乏 这 些 特性 会 带 来 什么 后 果 。 我 们 的 目标 是 , 对 于 给 定 的 问题 及 求解 方案 的 限制 永远 尽 
量 在 最 高 抽象 层 工作 。 在 本 章 和 第 18 、19 章 中 , 我 们 通过 向 量 的 实现 来 介绍 如 何 回 到 抽象 的 更 舒 
服 的 层次 。 
17. 3. 1 运算 符 sizeof 

那么 , 一 个 int 实际 占用 多 少 内 存 ? 一 个 指针 ? 操作 符 sizeof 会 回答 这 些 问 题 ， 

cout << "the size of char is " << sizeof(char) << '' << sizeof (an << \n'; 

Fou Ss he Size of int is " << sizeof(int) << '’ << sizeof (2+2) << \n'; 

ee Hn Size of int* is " << sizeof(int*) << ' ' << sizeof (p) << \n'; 
正如 你 所 看 到 的 , 我 们 可 以 将 sizeof 用 于 一 个 类 型 名 或 表达 式 。 对 于 一 个 类 型 名 来 说 ，sizeof 给 出 
这 种 类 型 对 象 的 大 小 ; 对 于 一 个 表达 式 来 说 ，sizeof 给 出 表达 式 结果 的 大 小 。sizeof 的 结果 是 一 个 
正 整 数 ，sizeof( char) 单 元 的 大 小 被 定义 为 1。 在 典型 情况 下 ,一 个 char 被 保存 在 一 个 字 节 中 , 因 
此 sizeof 会 报告 占用 的 字 节 数 。 | | 

试 一 试 执行 上 面 这 个 例 | 子 ， 并 看 我 们 能 得 到 什么 o 然后 ， 扩展 这 个 例子 以 决定 

bool、double 和 其 他 类 型 的 大 小 。 | 
每 个 C++ 实现 并 不 保证 一 种 类 型 的 大 小 相同 。 目 前 ，sizeof(int) 在 台式 机 或 笔记 本 中 通常 为 4 个 
字 节 。 如 果 使 用 8 比特 的 字 节 , 那 就 意味 着 一 个 int 是 32 比特。 但 是 , 移入 式 系 统 通 常 使 用 16 比 
特 的 int 型 , 而 高 性 能 体系 结构 使 用 64 比特 的 int 型 。 

一 个 向 量 使 用 多 少 内 存 ? 我 们 可 以 尝试 如 下 : 


vector<int> v(1000); 
cout << "the size of vector<int>(1000) is " << sizeof (v) << \n'; 


这 个 输出 将 会 像 这 样 : 

the size of vector<int>(1000) is 20 
看 过 本 章 和 第 18 章 ( 以 及 19.2.1 节 ) 的 介绍 后 ， 这 个 解释 将 会 变 得 很 明显 ， 但 是 sizeof 明显 不 能 
用 于 统计 向 量 元 素数 量 。 


17.4 自由 空间 和 指针 


思考 一 下 17.2 方 结尾 的 癌 量 实现 。 回 量 从 哪里 获得 它 的 元 素 的 空间 ? 我 们 如 何 使 指针 elem 
指向 它们 ? 当 你 开始 一 个 C++ 程序 时 ,编译 器 为 你 的 代码 分 配 内 存 ( 有 时 称 为 代码 存储 或 文本 存 
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储 ) ， 以 及 为 你 定义 的 全 局 变量 分 配 内 存 ( 称 为 静态 存储 ) 。 当 你 需要 调用 函数 或 你 的 参数 和 本 地 
变量 需要 空间 ( 称 为 堆栈 存储 或 自动 存储 ) 时 ,编译 器 也 会 为 它 分 配 ”内存 分 配 : 
一 些 内 存 。 计 算 机 中 的 其 他 内 存 可 用 于 其 他 应 用 ; 它 是 “空闲 的 ”。 

我 们 可 以 用 右 图 来 说 明 。C++ 语 言 用 称 为 new 的 操作 符 将 “空闲 存 

储 ”( 又 称 为 堆 ) 变 为 可 用 状态 。 例 如 : 


double* p = new doubie[4]; // allocate 4 doubles on the free store 
这 就 要 求 C++ 运行 时 系统 在 空闲 空间 中 分 配 4 个 double, 并 且 为 我 们 
返回 一 个 指向 第 一 个 double 的 指针 。 我 们 使 用 得 到 的 指针 来 初始 化 指针 变量 p。 我 们 可 以 用 下 图 
来 表示 : : z : : 
new 操作 符 返回 一 个 指向 它 创 建 的 对 和 象 的 指针 。 pm 自由 空间 
如 果 它 创建 了 多 个 对 象 (一 个 数组 ), 它 返 回 一 和 天 全 
个 指向 这 些 对 象 中 的 第 一 个 对 象 的 指针 。 如 果 
对 象 的 类 型 是 X ,由 new 返回 的 指针 类 型 是 

”。 例 如 : 

char* q = new double[l4]; .Verror double* assigned to char* 
new 返回 一 个 指向 一 个 double 的 指针 , 而 一 个 double 并 不 是 一 个 char, 因此 我 们 不 能 将 它 分 配给 
指向 char 的 变量 q。 : 
17. 4.1 自由 空间 分 配 

我 们 要 求 使 用 new 操作 符 从 空闲 空间 中 分 配 内 存 : 

。 new 操作 符 返 回 一 个 指向 被 分 配 内 存 的 指针 。 

。 一 个 指针 的 值 是 内 存 中 首 字 市 的 地 址 。 

。 一 个 指针 指向 一 个 特定 类 型 的 对 象 。 

。 一 个 指针 并 不 知道 它 指向 多 少 个 元 素 。 
new 操作 符 可 以 为 单个 元 素 或 一 系列 (数组 ) 元 素 分 配 内 存 。 A 








int* pi = new int; ~ Wallocate one int ， 
int* qi = new int[4]; /allocate 4 ints (an array of 4 ints) 
double* pd = new double; // allocate one double 


double* qd =new double[ln];  //allocate n doubles (an array of n doubies) ， 
注意 , 分 配 的 对 象 数 量 可 能 是 变化 的 。 由 于 允许 我 们 在 运行 时 选择 分 配 多 少 个 对 象 , 因此 它 是 很 
重要 的 。 如 果 n 等 于 2, 我 们 得 到 右 图 。 指 向 不 同类 型 。 pt 了 一 
变量 的 指针 类 型 不 同 。 例 如 : 


pi=pd; /error: can't assign a double* to an int* 
pd=pi; /error: can't assign an int* to a double* . 


为 什么 不 ?毕竟 , 我 们 可 以 将 int 赋 给 double 和 将 
double 赋 给 int。 原 因 在 于 [ ] 操作 符 , 它 依赖 于 元 素 
类 型 的 大 小 , 以 指出 到 哪里 找到 一 个 元 素 。 例 如 ,qi[2] 在 内 存 中 比 qi[0] 大 两 个 int 的 大 
小 ,qd[2] 在 内 存 中 比 qd[0] 大 两 个 double 的 大 小 。 如 果 一 个 int 与 一 个 double 的 大 小 不 同 
(在 很 多 计算 机 中 都 是 这 样 ) , 那么 如 果 我 们 允许 将 qi 指向 分 配给 qd 的 内 存 , 我 们 将 会 得 到 
一 些 奇 怪 的 结果 。 

这 是 “实际 的 解释 ”。 理 论 上 的 解释 是 “允许 为 指针 分 配 不 同类 型 将 会 导致 类 型 错误 ”。 
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17. 4.2 通过 指针 访问 数据 
另外 , 在 一 个 指针 上 使 用 解 引用 操作 符 ”, 我 们 就 可 以 使 用 下 标 操 作 符 [ ] 。 例 如 ; 


double* p = new double[4]; // allocate 4 doubles on the free store 
double x = *p; I read the (first) object pointed to by p 
double y = p[2]; // read the 3rd object pointed to by p 


不 出 所 料 , 下 标 操作 符 和 向 量 的 下 标 操 作 符 一 样 都 是 从 0 开始 计数 , 因此 p[2] 是 第 三 个 元 素 ; 
p[0] 是 第 一 个 元 素 , 因此 p[0] 实 际 上 与 ”p 相同 。[ ] 和 ”操作 符 也 可 以 用 于 写 入 : 


"p=7.7; /write to the (first object pointed to by p 
p[2] = 9.9; /write to the 3rd object pointed to by p 


一 个 指针 指向 内 存 中 的 一 个 对 象 。“ 内容" 操作 符 ( 又 称 为 解 引 用 操作 符 ) 允许 我 们 读 取 或 写 人 指 
针 p 指向 的 对 象 : 


doublex="*p; /read the object pointed to byp 
*p = 8.8; /write to the object pointed to by p 


当 我 们 使 用 一 个 指针 时 ,[ ] 操作 符 将 内 存 看 做 一 系列 的 对 象 ( 其 类 型 在 指针 声明 时 指定 ), 并 且 用 


指针 p 指向 第 一 个 对 象 : 
double x = p[3]; I/ read the 4th object pointed to by p 
pr[3] = 4.4; /write to the 4th object pointed to by p 
double y = piI0]; I pI0] is the same as *p 


这 就 是 全 部 。 这 里 没有 检查 和 巧妙 的 实现 , 只 是 简单 地 访问 我 们 计算 机 的 内 存 : 


p[0]: pl]: 






这 确实 是 简单 和 最 有 效率 的 访问 内 存 的 机 制 , 它 是 我 们 在 实现 一 个 向 量 时 所 需要 的 。 
17. 4. 3 指针 范围 


指针 带 来 的 主要 问题 是 一 个 指针 并 不 “知道 " 它 指向 多 少 个 元 素 。 考 虑 下 面 的 代码 : 
double* pd = new double[3]; 

pd[2] = 2.2; 

pd[4] = 4.4; 

pd[-3] = -3.3; 


pd 是 否 有 第 三 个 元 素 pd[2]? 它 是 否 有 第 五 个 元 素 pd[4]? 如 果 查 看 pd 的 定义 , 我 们 发 现 答案 
可 以 分 别 是 “是 ”" 和 “ 否 ”。 但是, 编译 器 不 知道 这 些 ; 它 并 不 跟踪 指针 的 值 。 如 果 我 们 分 配 足够 多 
的 内 存 , 代码 将 会 简单 地 访问 内 存 。 如 果 将 三 个 double 放 在 pd 指向 的 内 存 部 分 之 前 , 程序 甚至 
会 访问 pd[ -3]: 


日 Lp Eig 
ped: Fi 






和 pd[-2]: : ~、 pd[oj: : 
eh a i 


我 们 并 不 知道 pd[ -3] 与 pdL4] 被 分 配 的 内 存 位 置 。 但 是 ,即使 我 们 知道 也 不 意味 着 它们 可 以 用 
于 作为 包含 三 个 double 指针 的 指针 数组 pd 的 一 部 分 。 最 有 可 能 的 是 , 它们 是 其 他 对 象 的 一 部 分 ， 
并 且 我 们 只 是 胡乱 写 入 它们 , 这 不 是 一 个 好 主意 。 实 际 上 , 这 是 一 个 典型 的 灾难 性 的 坏 主 意 :“ 灾 
难 性 "表现 在 "程序 神秘 地 上 崩溃 "或 “程序 得 到 错误 的 输出 " 。 尝 试 着 大 声 说 出 来 , 尽管 它 听 起 来 根 


本 不 好 , 我 们 要 走 很 长 一 段 路 去 避免 它 。 越 界 访问 是 特别 令 人 讨厌 的 , 这 是 由 于 程序 中 无 关 的 部 
分 显然 会 受到 影响 。 一 次 越界 的 读 取 会 给 我 们 一 个 “随机 " 值 , 这 可 能 依赖 于 某 些 完全 无 关 的 计 
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算 。 一 次 越界 的 写 人 会 将 某 些 对 象 变 成 “不 可 能 ”的 状态 , 或 者 简单 地 为 它 赋予 一 个 不 期 望 和 错误 
的 值 。 这 种 写 人 直到 发 生 后 很 长 时 间 通 常 不 会 被 注意 到 , 因此 它们 很 难 被 发 现 。 更 糟糕 的 是 : 你 
运行 一 个 带 有 越界 错误 的 程序 两 次 , 输入 稍 有 不 同 就 可 能 出 现 不 同 的 结果 。 这 种 错误 (“ 临 时 性 错 
误 ”) 是 最 难 发 现 的 错误 之 一 。 

我 们 必须 保证 不 出 现 这 种 越界 的 访问 。 我 们 使 用 vector 而 不 是 直接 使 用 new 来 分 配 内 存 的 原 

因 之 一 是 vector 知道 它 的 大 小 , 这 样 就 很 容易 避免 越界 的 访问 。 

使 避免 越界 的 访问 变 得 困难 的 是 , 我 们 可 以 将 一 个 double” 赋予 另 一 个 double”, 而 不 必 去 管 

每 个 指针 指向 多 少 个 对 象 。 一 个 指针 实际 上 并 不 知道 它 指向 多 少 个 对 象 。 例 如 : 


double* p = new double; / allocate a double 
double* q = new doubleI1000]; /1 allocate 1000 doubles 


~ q1700] = 7.7; /fine 
q=P; /let q point to the same asp 
double d= = qI700]; / out-of- -range access! 


这 里 只 4 有 3 行 代码 ,q[700] 涉 及 两 个 不 同 的 内 存 位 置 ， 最 后 一 一 次 使 用 是 越界 的 访问 , 并 且 是 一 个 
可 能 出 现 的 灾难 ,如 右 图 所 示 。 现 在 , 我 们 希望 p 攻 有 
你 会 问 “ 为 什么 指针 不 会 记 住 自己 的 大 小 ”? 很 显 
然 , 我 们 可 以 设计 一 个 可 以 记 住 大 小 的 “指针 ”， 9 本 2 
向 量 就 是 这 样 的 指针 。 如 果 你 阅读 C++ 文献 和 
库 , 你 将 会 发 现 很 多 “聪明 的 指针 ”可 以 弥补 这 些 
低层 次 指针 的 缺陷 。 但 是 , 有 时 我 们 需要 接触 硬件 层次 和 了 人 解 对 象 如何 编 址 , 一 台 机 费 的 地 址 并 
不 知道 它 指向 的 是 什么 。 另 外 , 理解 指针 与 理解 大 量 的 实际 代码 同样 重要 。 
17. 4. 4 ”初始 化 

我 们 永远 要 保证 使 用 对 象 之 前 为 它 赋 一 个 值 , 也 就 是 说 ， 我 们 着 望 确认 指针 被 初始 化 ,并 且 
指针 指向 的 对 象 被 初始 化 。 思 考 下 面 的 代码 : 


double* pO0; 1 uninitialized: likely trouble 

double* pl1 = new double; // get (allocate) an uninitialized double 
double* p2 = new double(5.5); // geta double initialized to 5.5 
double* p3 = new double[5]; < //get (allocate) 5 uninitialized doubles 


很 明显 , 声明 p0 但 没有 初始 化 它 会 带 来 麻烦 。 如 下 所 示 : 

*p0 = 7.0; , 
本 行 代码 将 7.0 赋 给 内 存 中 的 某 些 位 置 。 我 们 并 不 知道 将 会 是 哪 部 分 内 存 。 它 可 能 是 无 害 的 , 但 
是 永远 不 要 这 样 做 。 我 们 迟早 会 得 到 与 越界 的 访问 相同 的 结果 :“ 程 序 神秘 地 崩溃 ”或 “程序 得 到 
错误 的 输出 ”。 对 于 老式 C++ 程序 (“C 风格 程序 " ) , 严重 错误 中 的 很 大 比例 是 由 未 初始 化 指针 的 
访问 或 越界 的 访问 而 引起 的 。 我 们 必须 尽 最 大 努力 去 避免 这 种 访问 , 一 部 分 原因 是 我 们 着 腿 于 专 
业 化 , 另 一 部 分 原因 是 我 们 不 想 浪 费时 间 查 找 这 种 错误 。 很 少 有 事情 像 查 找 这 种 错误 一 样 令 人 泪 
立 和 厌倦 。 避 免 错 误 而 不 是 查找 它 更 令 人 愉快 和 有 效率 。 

使 用 new 分 配 内 存 不 会 初始 化 内 置 的 类 型 。 如 果 你 不 想 对 单独 的 对 象 这 样 做 ， 你 可 以 像 对 p2 


IE 
为 由 new 分 配 的 内 置 类 型 的 数组 对 象 指定 初始 化 并 不 方便 。 | 如 果 我 们 不 喜欢 


默认 的 初始 化 , 我 们 就 必须 自己 做 一 些 工作 。 Wi 
double* p4 = new doublel5]; , 
for (inti = 0; i<5; ++i) p4[il = i; 
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现在 , p4 指向 double 类 型 的 变量 , 包括 0.0、1.0、2.0、3.0 和 4.0。 

像 往常 一 样 , 我 们 应 该 关心 未 初始 化 的 对 象 , 并 确认 我 们 在 读 取 它 之 前 已 为 它 赋 值 。 注 意 纺 
译 器 经 常 有 一 个 “调试 模式 ”, 每 个 变量 被 默认 初始 化 成 一 个 预期 值 (通常 为 0) 。 这 意味 着 当 关闭 
调试 模式 并 运行 程序 时 ， 当 运行 一 个 优化 的 程序 时 , 或 只 是 简单 地 在 不 同 机 器 上 编译 时 , 带 有 未 
初始 化 变量 的 程序 可 能 马上 显示 出 差异 。 不 要 被 未 初始 化 的 变量 牵 着 鼻子 走 。 

当 我 们 定义 自己 的 类 型 时 , 我 们 可 以 更 好 地 控制 初始 化 。 如 果 一 个 类 型 X 有 一 个 默认 的 构造 
函数 , 我 们 得 到 : 


X* px1 = new X; // one default-initialized X 
X* px2 = new X[17]; /1 17 default-initialized Xs 


如 果 一 个 类 型 Y 有 一 个 构造 范 数 , 但 不 是 默认 的 构造 函数 , 我 们 需要 显 式 地 初始 化 : 
Y* py1 = new Y; / error: no default constructor 
Y* py2 = new Y[17]; // error: no default constructor 
Y* py3 = new Y(13); / OK: initialized toY(13) 


17. 4.5 空 指针 

如 果 你 没有 其 他 指针 用 于 初始 化 一 个 指针 , 那么 使 用 0: 

double* p0 = 0; // the null pointer 
当 0 被 赋 给 一 个 指针 时 , 0 被 称 为 空 指针 。 我 们 经 常 通过 检测 指针 是 否 为 0, 以 判断 一 个 指针 是 否 
有 效 ( 如 它 是 否 指向 什么 东西 )。 例 如 : 

if (p01=0) /consider pO valid 
这 并 不 是 一 个 完美 的 测试 , 这 是 由 于 p0 可 能 包含 一 个 碰巧 不 是 0 的 “随机 " 值 , 或 者 一 个 已 经 被 
删除 对 象 的 地 址 (参见 17. 4.6 节 )。 但 是 , 它 经 常 是 我 们 所 能 做 得 最 好 的 。 我 们 实际 上 不 会 明确 
地 提 到 0, 这 是 由 于 六 语 句 会 检测 是 否 它 的 条 件 为 非 0: 

if (p0) // consider pO valid; equivalent to p01=0 
考虑 到 它 更 直接 表达 “p0 有 效 ” 的 思想 , 我 们 比较 喜欢 这 种 短 的 模式 ,但 是 也 有 不 同意 见 。 

当 我 们 有 一 个 指针 有 时 指向 一 个 对 象 而 有 时 不 指向 时 , 我 们 就 需要 使 用 空 指 针 。 它 比 很 多 人 
的 想法 更 少见 , 思考 一 下 ; 如 果 你 并 没有 一 个 对 象 由 指针 来 引用 ,为 什么 你 需要 定义 那个 指针 ? 
你 不 能 等 到 有 一 个 对 象 时 再 做 吗 ? 
17.4.6 自由 空间 释放 

new 操作 符 会 从 自由 空间 中 分 配 内 存 。 由 于 一 台 计 算 机 的 内 存 是 有 限 的 , 因此 在 使 用 结束 后 
将 内 存 释 放 回 自由 空间 通常 是 一 个 好 主意 。 这 样 自由 空间 可 以 将 这 些 内 存 重新 用 于 新 的 分 配 。 
对 于 大 型 的 程序 和 长 时 间 运 行 的 程序 来 说 , 这 种 自由 空间 的 重新 使 用 是 很 重要 的 。 例 如 ， 


double* calc(int res_size, int max) // leaks memory 
{《 
-double* p = new doublefmax]; 
double* res = new double[res_size]; 
/use pto calculate results to be put in res 
return res; 


} 

double* r = calc(100,1000); 
在 写 操作 时 , 每 次 调用 calc( ) 会 造成 分 配给 p 的 double 数组 “泄漏”。 例如 ， 调用 calc(100, 1000) 
将 会 分 配 100 个 double 的 空间 , 而 这 些 空间 无 法 被 程序 其 他 部 分 使 用 。 

将 内 存 返 回 自由 空间 的 操作 符 称 为 delete。 我 们 对 一 个 指针 使 用 delete 返回 用 new 分 配 的 内 
存 , 以 使 这 些 内 存 可 以 用 于 未 来 的 分 配 。 现 在 , 这 个 例子 变 为 : 


352 “党 三 部 分 “发 据 结 欧 布 蔓 法 


double* calc(int res_size, int max) 
// the caller is responsibie for the memory allocated for res 
{ 
double* p = new double[max}]; 
double* res = new doublefres_size]; 
/ use p to calcujate results to be put in res 
deletel] p; /we don't need that memory anymore: free it 
return res; 


} 


double* r = cajc(100,1000)， 
/user 
deletel] r; // we don't need that memory anymore: free it 


顺便 说 一 句 ， 这 个 例子 证 明 使 用 自由 内 存 的 一 个 主要 原因 ; 我 们 可 以 在 一 个 肾 数 中 创建 对 象 , 并 
将 它们 传送 给 函数 的 调用 者 。 

这 里 有 两 种 形式 的 delete: 

。 delete p 释放 由 new 分 配给 单个 对 象 的 内 存 。 

。 delete[ jp 释放 由 new 分 配给 数组 对 象 的 内 存 。 
对 于 程序 员 来 说 , 使 用 正确 的 方式 是 一 件 乏 味 的 工作 。 

删除 一 个 对 象 两 次 是 一 个 糟糕 的 错误 。 例 如 : 


int* p = new int(5); 


delete p; / fine: p points to an object created by new 
/...no use ofp here... 
delete p; / error: p points to memory owned by the free-store manager 


第 二 个 delete p 带 来 两 个 问题 ; 
。 因此 自由 空间 管理 器 可 能 会 改变 它 的 内 部 数据 结构 ， 导致 无 法 再次 正确 地 执行 delete p， 
你 已 不 再 拥有 指针 所 指向 的 对 象 。 
。 自由 空间 管理 可 能 已 “回收 "p 指向 的 内 存 , 因此 p 现在 可 能 指向 其 他 对 象 ; 删除 其 他 对 象 
(由 程序 的 其 他 部 分 所 拥有 ) 将 会 在 你 的 程序 中 引起 错误 。 
这 两 个 问题 都 发 生 在 实际 的 程序 中 ; 它们 不 只 是 在 理论 上 有 可 能 性 。 
删除 空 指针 不 会 做 任何 事 ( 因为 空 指针 不 指向 一 个 对 象 ) ， 因此 删除 空 指针 是 无 害 的 。 例如 : 


int* p= 0; 
delete p; // fine: no action needed 
delete p; // also fine (still no action needed) 


为 什么 我 们 都 会 被 自由 内 存 所 困扰 ? 编译 器 不 能 指出 我 们 什么 时 候 不 需要 一 段 内 存 , 并 在 没有 人 
工 干 预 的 情况 下 将 它 回 收 吗 ? 它 可 以 。 这 个 过 程 称 为 自动 垃圾 收集 或 垃圾 收集 。 不 幸 的 是 , 自动 
垃圾 收集 并 不 是 免费 的 , 并 且 不 是 对 所 有 应 用 都 是 理想 的 。 如 果 你 实际 需要 自动 垃圾 收集 , 你 可 
以 将 一 个 自动 垃圾 收集 器 插入 你 的 C++ 程序。 好 的 垃圾 收集 器 是 有 效 的 ( 见 www. research. 
att. com/ ~ bs/C++. html)。 但 是 ,本 书 假设 你 需要 自己 处 理 “ 垃 圾 ”, 并 且 我 们 教 你 如 何方 便 和 有 
效 地 来 做 。 : 

在 什么 时 候 不 泄漏 内 存 是 重要 的 ? 一 个 “永远 "运行 的 程序 不 能 承受 泄漏 内 存 。 一 个 不 能 有 
内 存 泄 漏 的 操作 系统 是 “永远 运行 的 ”程序 的 例子 , 大 多 数 的 柚 人 式 系统 (参见 第 25 章 ) 也 是 这 
样 。 很 多 程序 使 用 库 作为 系统 的 一 部 分 , 因此 库 也 不 能 出 现 内 存 泄漏 的 问题 。 一 般 来 说 , 所 有 程 
序 都 不 产生 内 存 泄漏 是 个 好 主意 。 很 多 程序 员 将 泄漏 的 原因 归结 于 马虎 , 但 是 ,这 并 没有 切中 要 
点 。 当 你 在 一 种 操作 系统 (UNIX、Windows 等 ) 上 运行 程序 , 在 程序 结束 时 会 将 所 有 内 存 自动 返回 
给 系统 。 这 会 带 来 一 个 问题 , 如 果 你 知道 你 的 程序 不 会 使 用 比 可 用 更 多 的 内 存 , 你 可 能 “合理 地 ” 
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决定 泄漏 内 存 直 到 操作 系统 为 你 释放 内 存 。 但 是 , 如果 你 决定 要 这 样 做 ， 确定 你 所 估计 的 内 存 消 
耗 是 正确 的 , 否则 人 们 将 会 有 好 的 理由 认为 你 是 草率 的 。 


17.5 析 构 函数 


现在 , 我 们 知道 如 何 为 一 个 向 量 保 存 元 素 。 我 们 简单 地 为 这 些 元 素 在 自由 空间 中 分 配 足 够 的 
空间 , 并 且 通 过 一 个 指针 来 访问 它们 : 


/a very simplified vector of doubles 


class vector { 
int sz; // the size 
double* elem; //a pointer to the elements 
public: 
vector(int s) AH constructor 
:sz(S), / initialize sz 
elem(new double[s]) / initialize elem 


for (int i=0; i<s; ++i) elem[i]=0; /initialize elements 
int size() const { return sz; } /the current size 


}; 
因此 ,sz 是 元 素 的 数量 。 我 们 在 构造 晒 数 中 初始 化 它 , 用 户 可 以 通过 调用 size( ) 得 到 向 量 中 的 元 
素数 量 。 在 构造 阻 数 中 使 用 new 来 分 配 元 素 空间 ， 从 自 由 空间 返回 的 指针 被 保存 在 成 员 指针 
elem 中 。 

注意 ， 我 们 将 这 些 元 素 初 始 化 为 它们 的 默认 值 (0. 0)。 慰 准 库 向 量 会 这 样 做 ， 因此 我 们 认为 
最 好 从 开始 就 这 样 做 。 

不 幸 的 是 ， 我 们 最 初 的 vector 会 泄漏 内 存 。 在 构造 函数 中 ， 它 使 用 new 来 为 元 紊 分 配 内 
存 。 遵 循 在 17.4 节 中 描述 的 规则 , 我 们 必须 确认 使 用 delete 释放 这 些 内 存 。 思 考 下 面 的 
代码 : 

void flint m) 

{ 有 
vector v(n); // allocate n doubles 


} 
当 我 们 离开 函数 人 ) 时 ,v 在 自由 空间 中 创建 的 元 素 没 有 释放 。 我 们 可 以 为 vector 定义 一 个 clean_ 


void f2(int n) 

{ 
vector v(n); / define a vector (which allocates another n ints) 
lH...Usev.. 
V。 eleaii Lp // clean_up() deletes elem 


} 
它 可 以 工作 。 但 是 , 有 关 自 由 空间 的 一 个 最 常见 的 问题 是 人 们 忘记 delete。clean_up() 可 能 会 带 
来 相关 的 问题 ; 人 们 可 能 忘记 调用 它 。 我 们 可 以 做 得 更 好 ， 基 本 思路 是 使 编译 器 知道 一 个 函数 可 
以 做 与 构造 函数 相反 的 功能 ， 就 像 编 译 器 了 解构 造 函 数 一 样 。 这 个 函数 不 可 避免 地 被 称 为 析 构 函 
数 。 同 样 , 在 一 个 对 象 的 类 创建 时 会 隐 式 调用 构造 函数 ， 当 一 个 对 象 离开 作用 域 时 会 隐 式 调用 析 
构 函 数 。 人 与 之 相反 , 析 构 函数 用 于 确认 一 
个 对 象 是 否 被 正确 销 筑 。 例 如 : 
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/avery simpiified vector of doubles 


class vector { 
int sz; /the size 
double* elem; //a pointer to the elements 
public: 
vector(int s) H constructor 
;SZ(S), elem(new double[s]) // allocate memory 
{ | 
for (int ji=0; i<s; ++i) elem[i]=0; /initialize elements 
} 
~Vvector() H destructor 


{ deletel[] elem; } W free memory 
// . ,， 
}; 


有 了 这 个 定义 , 我 们 就 可 以 这 样 使 用 vector 了 : 


void f3(int n) 
{ 
int* p=new int[n]; /allocate n ints 
vector v(n); / define a vector (which allocates another n ints) 
lH...usepandv.,. 
dejete[] p; // dealjocate the ints 


} //vector automaticajly cleans up after v 
delete[ ] 看 起 来 相当 繁琐 并 且 容 易 出 错 。 对 于 vector, 我 们 不 必 使 用 new 分 配 内 存 , 以 及 在 函数 结 
束 时 使 用 deletef ] 释 放 内 存 。vector 已 经 做 了 这 些 工作 , 而 且 做 得 更 好 。 特 别 是 ,vector 不 能 忘记 
调用 它 的 析 构 函数 释放 元 素 使 用 的 内 存 。 

我 们 在 这 里 并 不 打算 介绍 析 构 函数 使 用 的 更 多 细节 , 但 是 它们 对 于 处 理 资源 来 说 很 重要 ， 这 
些 资 源 需 要 使 用 前 申请 和 使 用 后 释放 : 文件 、 线程 、 锁 等 。 记 住 iostream 如 何在 使 用 后 清除 自己 ， 
它们 刷新 缓冲 区 、 关闭 文件 、 释放 缓冲 区 空间 等 。 这 些 工 作 由 它们 的 析 构 函数 完成 ， 每 个 “拥有 ” 
资源 的 类 都 需要 一 个 析 构 函数 。 
17. 5.1 生成 的 析 构 函数 

如 果 一 个 类 的 成 员 拥 有 一 个 析 构 函数 , 则 在 包含 这 个 成 员 的 对 象 销毁 时 调用 这 个 析 构 函数 。 例 如 : 


struct Customer { 
string name; 
a dadresses, 
1/.. : 

}; 


void some_fct() 

{ 
Customer fred; 
ff initialize fred 
Ause fred 

} 


当 我 们 退出 函数 some_fct( ) 时 ，fred 将 会 离开 作用 域 , 因此 fred 要 被 销毁 ; 也 就 是 说 ,name 和 ad- 
dresses 的 析 构 函数 被 调用 。 这 个 过 程 对 于 析 构 蚂 数 的 可 用 性 明 : 显 很 重要 , 它 有 时 被 表达 为 “编译 
器 为 Customer 生成 一 个 析 构 消 数 , 它 调 用 成 员 的 析 构 函数 ”。“ 析 构 函 数 应 被 调用 "这 一 显然 而 必 
要 的 保证 通常 就 是 如 此 实现 的 。 

成 员 和 基 类 的 析 构 函数 在 从 派生 类 的 析 构 函数 (无 论 用 户 定义 或 编译 器 生成 ) 中 被 隐 式 调用 。 
基本 上 , 所 有 的 规则 可 以 被 总 结 为 :“ 当 对 象 被 销毁 时 , 析 构 聘 数 被 调用 ”( 当 离 开 作 用 域 时 、 当 
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delete 被 调用 时 等 )。 
17. 5.2 析 构 函数 和 自由 空间 

析 构 函数 从 概念 上 来 说 是 简单 的 , 但 它 是 大 多 数 有 效 的 C++ 编程 技术 的 基础 。 它 的 基本 思 
路 是 简单 的 : 

。 无 论 一 个 类 对 象 需要 使 用 哪 种 资源 , 这 种 资源 都 要 在 构造 函数 中 获得 。 

。 在 对 象 的 生命 期 中 , 它 可 以 释放 资源 和 获得 新 的 资源 。 

。 在 对 象 的 生命 期 结束 后 , 析 构 函数 释放 对 象 拥有 的 所 有 资源 。 
在 vector 中 处 理 自由 空间 的 一 对 构造 函数 、 析 构 函 数 是 一 个 典型 的 例子 。 我 们 将 在 19. 5 节 中 提供 
这 种 思路 的 更 多 例子 。 在 这 里 , 我 们 将 测试 一 个 重要 的 应 用 , 它 是 目 由 空间 使 用 和 类 层次 关系 的 
结合 。 思 考 下 面 的 代码 : 

Shape* fct() 

{ 


Text tt(Point(200,200),"Annemarie"); 
1 


Shape* p = new Text(Point(100,100),"Nicholas"); 
return p; 


} 


void f() 

| shape* q = fct(); 

ds 
delete q; 

} 

这 看 起 来 相当 合理 , 确实 是 这 样 。 它 完全 工作 正常 ,让 我 们 通过 分 析 它 是 如 何 工作 的 来 揭示 一 些 
精湛 、 重 要 和 简单 的 技术 。 在 函数 fct( ) 中 ,Text 对 象 tt 在 离开 fct( ) 时 被 销毁 。Text 有 一 个 string 
成 员 , 很 明显 需要 调用 它 的 析 构 函数 ，string 像 vector 一 样 处 理 内 存 的 获取 和 释放 。 因 此 对 于 tt 来 
说 是 容易 的 ; 编译 器 只 需 像 17. 5. 1 节 中 描述 的 那样 调用 Text 生成 的 析 构 函数 。 但 是 ， 从 fet( ) 返 

回 的 Text 对 象 是 什么 ? 调用 函数 f( ) 完 全 不 知道 g 指向 一 个 Text; 它 只 知道 q 指 向 一 个 Shape。 
delete q 如 何 调用 Text 的 析 构 函数 ? 

在 14.2.1 节 中 , 我 们 快速 掠 过 一 个 事实 : Shape 有 一 个 析 构 函数 。 实际 上 ， Shape 有 一 个 虚 的 
析 构 函数 , 这 正 是 问题 的 关键 。 当 我 们 使 用 delete q 时 ，delete 会 查看 q 的 类 型 ， 以 确定 是 否 需 要 
调用 析 构 函数 ,如 果 是 就 调用 它 。 因 此 ，delete q 调用 Shape 的 析 构 函数 ~ Shape( )。 但 是 ， 
~ Shape( ) 是 虚 函 数 , 因此 使 用 虚 图 数 调 用 机 制 ( 见 14. 3. 1 节 ) , 这 个 调用 会 引用 Shape 的 派生 类 
的 析 构 函数 , 在 这 里 是 ~ Text( ) 。 如 果 Shape :: ~ Shape( ) 不 是 虚 函 数 ，Text :: ~ Text( ) 将 不 会 被 
调用 , 并 且 Text 的 string 成 员 将 不 会 被 销毁 。 

作为 一 个 经 验 法 则 : 如 果 你 有 一 个 带 有 虚 函 数 功能 的 类 , 则 它 需 要 一 个 虚 的 析 构 函数 。 具 体 
原因 是 : 

1) 如 果 一 个 类 有 虚 函 数 功能 , 它 经 常 作为 一 个 基 类 使 用 。 

2) 如 果 它 是 一 个 基 类 , 它 的 派生 类 经 常 使 用 new 来 分 配 。 

3) 如 果 一 个 派生 类 对 象 使 用 new 来 分 配 , 并 且 通 过 一 个 指向 它 的 基 类 的 指针 来 控制 , 那么 它 
经 常 通过 一 个 指向 它 的 基 类 的 指针 来 删除 它 。 z 
注意 , 析 构 函数 是 通过 delete 来 隐 式 或 间接 调用 。 它 们 并 不 是 直接 调用 的 。 这 样 会 省 去 很 多 麻烦 的 工作 。 
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试 一 试 编写 一 个 使 用 基 类 和 成 员 的 小 程序 ,自己 定义 构造 函数 和 析 构 函数 ,在 它 
们 被 调用 时 输出 一 行 信息 。 然 后 , 创建 几 个 对 象 并 查看 它们 的 构造 函数 和 析 构 函数 如 何 
被 调用 。 
17.6 访问 向 量 元 素 
为 了 使 vector 可 以 使 用 , 我 们 需要 一 种 读 和 写 元 素 的 方法 。 对 于 初学 者 来 说 , 我 们 可 以 提供 


简单 的 get( ) 和 set( ) 成 员 哨 数 : 

/a very simplified vector of doubles 

class vector { 
int sz; / the size | 
double* elem;  //a pointer to the elements 

public: 
vector(int s) :sz(s), elem(new double[ls])}) {} /constructor 
~vector() { delete[] elem; } . // destructor 
int size() const { return sz; } / the current size 
double get(int n) { return elem[n]; } / access: read 
void set(int n, double v) { elem[n]=v; } . ff access: write 


) 
get( ) 和 set( ) 都 可 以 访问 元 素 , 在 elem 指针 上 使 用 [ ] 操 作 符 : elem[ nj]。 
现在 , 我 们 可 以 生成 一 个 double 型 的 vector 并 使 用 它 : 


vector v(5); 
for (int i=0; icv,size(); ++i) { 
Vv.Set(i,1.1*1)); 
cout << "v[" << i << "]==" << v.get(i) << \n'; 
} 
这 里 将 会 输出 : 
vI0]==0 
Vv[1]==1.1 
v[2]==2.2 
v[3]==3.3 
v[4]==4.4 
这 仍 是 一 个 相当 简单 的 vector, 相对 于 常用 的 下 标 符号 来 说 , 使 用 get( ) 和 set( ) 的 代码 是 很 难看 
的 。 但 是 , 我 们 的 目的 是 从 小 的 和 简单 的 程序 开始 ， 沿 着 这 个 方式 逐步 测试 和 扩充 我 们 的 程序 。 


这 种 发 展 和 反复 测试 的 策略 可 以 减少 错误 和 调试 过 程 。 


17.7 指向 类 对 象 的 指针 


“指针 ”的 概念 是 通用 的 ， 因此 我 们 可 以 指向 可 分 配 内 存 的 任何 东西 。 例如 , 我 们 可 以 使 用 指 
向 vector 的 指针 ,就 像 我 们 使 用 指 问 char 的 指针 : 


vector* f(int S) 


{ 
‘vector* p = new vector(s); // allocate a vector on free store 
Hfill *p 
return p; 
} 
void ff() 
{ 
vector* q = {(4); 
/use *q 
delete q; 1 free vector on free store 
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注意 ， 当 我 们 删除 一 个 vector 时 , 它 的 析 构 函数 会 被 调用 。 例 如 : 


vector* p = new vector(s); //allocate a vector on free store 
delete p; | / deallocate 


在 自由 空间 中 创建 vector, new 操作 符 : 
。 首先 为 一 个 vector 分 配 内 存 。 
e。 然后 , 激活 vector 的 构造 函数 初始 化 vector; 构造 函数 为 vector 的 元 素 分 配 内 存 , 并 初始 化 
这 些 元 素 。 
删除 vector，delete 操作 符 : | 
。 首先 激活 vector 的 析 构 函数 ; 这 个 析 构 函数 激活 这 些 元 素 的 析 构 函数 (如 果 它 们 有 析 构 天 
数 ) ， 然 后 释放 这 些 元 素 使 用 的 内 人 存 。 
。 然后 , 释放 vector 使 用 的 内 存 。 
注意 , 这 个 工作 可 以 完美 地 递归 执行 ( 见 8. 5.8 节 )。 我 们 也 可 以 使 用 实际 的 (标准 库 ) vector 来 做 到 : 


vector< vector<double> >* p = new vector<vector<double> > (10); 
delete p; 


这 里 ，delete p 激活 vector < vector < double >> 的 析 构 卢 数 ; 接着 ,这 个 析 构 肾 数 激活 它 的 vector < 
double > 元 素 的 析 构 函数 , 所 有 相关 的 东西 完全 被 清除 , 不 会 留 下 未 销毁 的 对 象 和 泄漏 的 内 存 。 

由 于 delete 激活 析 构 函数 ( 为 某 种 类 型 ,例如 vector) ，delete 通常 称 为 销毁 对 象 ， 而 不 只 是 释 
放 它 们 。 

同样 ， 请 记 住 一 个 位 于 函数 之 外 的 “单独 的 "new, 将 会 带 来 忘记 删除 它 的 机 会 。 除 非 你 有 一 
个 删除 对 象 的 好 (确实 简单 , 例如 13. 10 节 和 附录 卫 4 中 的 Vector_ref) 的 策略 , 尽量 将 new 放 在 构 
造 范 数 中 ,以 及 将 delete 放 在 析 构 函数 中 。 

到 目前 为 止 一 切 很 好 , 但 是 , 如 果 仅 有 一 个 指针 , 我 们 如 何 访问 一 个 vector 的 成 员 ? 注意 ， 给 

一 个 对 象 名 ， 所 有 类 都 文 持 通 过 . ( 所 ) 操 作 符 来 访问 成 员 : 


vector v(4); 
int x = v.size(); 
double d = v.get(3); 


与 此 类 似 , 给 定 一 个 对 象 指针 ， 所 有 类 支持 通过 -> (第 头 ) 操 作 符 来 访问 成 员 : 


vector* p = new vector(4); 
int x = p—>size(); 
double d = p-—>get(3); 


《点 ) 和 ->(〈 箭 头 ) 可 以 用 于 数据 成 员 和 函数 成 员 。 由 于 内 置 类 型 (例如 int 和 double) 没 有 成 员 ， 
因此 -> 不 能 用 于 内 置 类 型 。 点 和 箭头 通常 称 为 成 员 访问 操作 符 。 


17.8 类 型 混用 : 无 类 型 指针 和 指针 类 型 转换 


在 使 用 指针 和 自由 空间 分 配 的 数组 时 , 我 们 非常 接近 硬件 层面 。 基 本 上 , 我 们 对 指针 的 操作 
(初始 化 、 分配、* 和 [ ] ) 直接 映射 为 机 器 指令 。 在 这 个 层次 , 语言 只 提供 一 点 描述 上 的 便利 ,以 
及 由 类 型 系统 提供 的 编译 时 的 一 致 性 。 偶 尔 ,我 们 不 得 不 放弃 这 最 后 一 点 保护 。 

通常 , 我 们 不 希望 在 没有 类 型 系统 的 保护 下 工作 , 但 是 有 时 没有 其 他 选择 (例如 , 我 们 需要 与 
无 法 识别 C++ 类 型 的 其 他 语言 交互 ) 。 我 们 有 时 也 会 遇 到 一 些 情况 ,我 们 需要 面 对 没 有 根据 安全 
类 型 设计 的 老 的 代码 。 在 这 种 情况 下 , 我们 需要 两 样 东 西 : 

。 一 种 指向 不 知道 自己 保存 的 是 何 种 对 象 的 内 存 的 指针 。 

。 一 种 操作 , 对 于 这 类 指针 , 它 告诉 编译 器 指针 指向 的 是 哪 种 (未 证 实 ) 的 操作 类 型 。 
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类 型 void* 的 含义 是 “指向 编译 器 不 知道 类 型 的 那些 内 存 ”。 当 我 们 想 在 两 段 代码 之 间 传输 一 
个 地 址 , 并 且 不 知道 每 段 代码 实际 的 类 型 时 , 就 可 以 使 用 void* 。 这 方面 的 例子 包括 在 回调 函数 
( 见 16.3.1 节 ) 讨 论 的 “地 址 ”和 最 低层 的 内 存 分 配器 (例如 new 操作 符 的 实现 ) 。 

不 存在 void 类 型 的 对 象 , 但 是 正如 我 们 看 到 的 , 通常 用 void 来 表示 “没有 返回 值 ”: 


voidv; /error: there are no objects of type void 
void f0); // f0) returns nothing 一 f0 does not return an object of type void 


我 们 可 以 将 指向 任意 对 象 的 指针 赋予 void”。 例 如 ; 


void* pvT = new int; 1 OK: int* converts to void* 
void* pv2 = new double[10]; /OK: double* converts to void* 


由 于 编译 器 不 知道 void* 指向 什么 , 因此 我 们 必须 告诉 它 : 
void f(void* pv) 
{ 


void* pv2=pv; /copying is OK (copying is what void*s are for) 
double* pd = pv; //error: cannot convert void* to double* 


*pv= 7; Herror cannot dereference a void* 
// (we don't know what type of :object it points to) 
pv[2] = // error: cannot subscript a void* 


int* bE ee SR /OK: explicit conversion 
1.. 
static_cast 可 以 用 于 两 种 相关 指针 类 型 之 间 的 强制 转换 , 例如 void” 与 double ( 见 附录 A.5.7)。 
“static_cast” 确 实 是 一 个 丑 隔 的 名 字 , 表示 一 个 丑陋 的 操作 , 我 们 只 在 完全 有 必要 时 才 使 用 它 , 通 
常 你 会 发 现 它 没有 必要 。 一 个 操作 (例如 static_cast) 称 为 明确 的 类 型 转换 (因为 这 就 是 它 所 做 的 
事 ) 或 口语 化 地 称 为 类 型 转换 (因为 它 常 用 于 被 破坏 的 数据 ) 。 
C++ 提供 两 个 潜在 的 比 static_cast 更 危险 的 转换 ; 


e reinterpret_cast 可 以 在 两 个 不 相关 的 类 型 之 间 转 换 , 例如 int 和 double”。 
e const_cast 可 以 “抛弃 常量 修饰 ”。 
例如 : 


Register* in = reinterpret_cast<Register*>(0xf; 


void f(const Buffer* p) 

{ 
Buffer* b = const_cast<Buffer*>(p); 
i... 

} 


第 一 个 例子 是 有 关 reinterpret_cast 使 用 的 经 典 例 子 。 我 们 告诉 编译 器 ， 内 存 中 的 某 个 特定 部 分 ( 开 
始 于 0xFF 位 置 的 内 存 , 如 右 图 所 示 。) 告 诉 编译 器 , 这 部 分 内 存 被 用 作 一 个 寄存 器 (了 可 能 结合 特定 
的 语法 使 用 ) 。 在 我 们 写 类 似 于 设备 驱动 程序 时 , 采用 这 种 代码 是 必要 的 。 in: 了 0 


在 第 二 个 例子 中 , const_cast 将 名 为 p 的 const Buffer” 的 属 性 抛弃 。 我 们 大 概 
知道 自己 在 做 什么 。 

static_cast 至 少 不 会 混淆 指针 /整数 或 出 现 “ 消 除 const”, 因此 在 你 感到 有 
必要 使 用 类 型 转换 时 最 好 用 static_cast。 当 你 认为 需要 进行 转换 时 , 重新 考 
虑 : 是 否 有 办 法 书写 代码 不 而 使 用 转换 ? 是 否 有 办 法 重新 设计 程序 部 分 而 不 使 用 转换 ?除非 你 需 
要 与 其 他 人 的 代码 或 硬件 打交道 , 通常 都 会 有 办 法 避免 类 型 转换 。 否 则 ,你 将 会 面 对 微 妙 和 讨厌 
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的 错误 。 你 不 要 期 望 使 用 reinterpret_cast 的 代码 可 以 移植 。 


17.9 指针 和 引用 


我 们 可 以 将 一 个 引用 看 做 是 一 个 自动 解 引用 的 、 不 可 改变 的 指针 或 是 一 个 对 象 的 别名 。 指 针 
和 引用 在 以 下 几 个 方面 不 同 : z | 

。 为 一 个 指针 赋值 会 改变 指针 的 值 (不 是 指针 指向 的 值 )。 

e 为 了 得 到 一 个 指针 , 你 通常 需要 使 用 new 或 &。 


。 为 了 访问 一 个 指针 指向 的 对 象 , 你 可 以 使 用 "或 [ ] 。 

。 为 一 个 引用 峰值 会 改变 引用 指向 的 值 (不 是 引用 上 自身 的 值 ) 。 

。 在 初始 化 一 个 引用 之 后 , 你 不 能 让 引用 指向 其 他 对 象 。 

。 为 引用 赋值 执行 深度 复制 ( 赋值 给 引用 的 对 象 ) ; 为 指针 赋值 不 是 这 样 ( 赋值 给 指针 自身 ) 。 
。 注意 空 指针 。 


例如 : 
int x = 10; 
int* p = &x; // you need & to get a pointer 
"pe7; // use * to assign to x through p 
int x2 = *p; / read x through p 
int* p2 = &x2; / get a pointer to another int 
p2=Pp; Ap2 and p both point to x 
p = &x2; / make p point to another object 
引用 的 相关 例子 如 下 : 
int y = 10; 
int&r=y; /the & is in the type, not in the initiajizer 
r=7; // assign to y through r (no * needed) 


inty2=r; /ready through r (no * needed) 

int& r2 = y2; // get a reference to another int 

r2=7; /the value of y is assigned to y2 

r= &y2; // error: you can't change the value of a reference 
/ (no assignment of an int* to an int&) 


注意 最 后 一 个 例子 , 它 是 不 正确 的 , 这 个 语法 结构 将 会 失败 。 这 是 由 于 初始 化 后 无 法 让 引用 指向 
不 同 的 对 象 , 如果 你 需要 指向 不 同 的 对 象 , 请 使 用 指针 。 了 解 如 何 使 用 指针 , 参见 17. 9.3 节 。 
引用 和 指针 都 是 通过 使 用 内 存 地 址 来 实现 的 。 它 们 只 是 在 地 址 的 使 用 上 不 同 , 为 编程 人 员 提 
供 稍 有 不 同 的 功能 。 1 
17. 9. 1 指针 参数 和 引用 参数 6 
当 你 希望 将 一 个 变量 的 值 改 为 由 函数 计算 出 的 结果 时 ， 你 有 3 种 选择 。 例 如 ; 


int incr_v(int x) { return x+1;} /compute a new value and return it 


void incr_p(int* p){++*Pp?; } /pass a pointer 
// (dereference it and increment the result) 
void incr_r(int& r) { ++r; } // pass a reference 
你 会 如 何 选 择 呢 ? 我 们 认为 返回 值 是 最 明显 的 代码 ( 因此 最 不 容易 出 错 ) , 那 就 是 : 
int x = 2; 


x=incr v(x); /copy x to incr_vO); then copy the result out and assign it 
对 于 小 的 对 象 , 例如 一 个 int, 我 们 倾向 使 用 这 种 风格 。 但 是 , 返回 或 向 前 心 一 个 值 并 不 总 是 可 
行 。 例 如 , 我 们 可 以 编写 一 个 函数 来 修改 一 个 大 的 数据 结构 , 例如 一 个 包含 10 000 个 int 的 向 量 ; 
我 们 不 能 以 可 接受 的 效率 拷贝 40 000 字 节 (至少 两 次 )。 
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我 们 如 何 选 择 使 用 引用 参数 还 是 指针 参数 呢 ? 不 幸 的 是 , 每 种 方法 都 有 自己 的 优点 和 缺点 ， 
因此 在 这 方面 仍 没有 明确 的 管 案 。 你 需要 根据 程序 功能 和 可 能 的 用 途 来 决定 。 
作用 放生 更 必 人 全 全 村 用 有 全 月 本 抽风 例如 : 


int x = 7; 
incr_p(&x) //the & isneeded 
incr_r(x); 


在 incr_p( &x) 中 使 用 & 通知 用 户 x 可 能 改变 。 与 之 对 比 ,， incr_r(x)“ 看 起 来 很 无 奉 ”。 这 导致 很 
多 人 稍微 偏爱 使 用 指针 。 

另 一 方面 ,如果 你 使 用 指针 作为 函数 的 参数 , 需要 防止 某 些 人 使 用 空 指针 来 调用 函数 , 空 指 
针 是 指 值 为 零 的 指针 。 例 如 : 


incr_p(0); WN crash: incr_p0 will try to dereference 0 
int* p=0; 
incr_p(p); Wcrash: incr_p() will ty to dereference 0 


这 明显 是 很 讨厌 的 。 编 写 incr_p( ) 的 人 可 以 防止 它 : 
void incr_plint* p) 
{ 
if (p==0) error("null pointer argument to incr_p()"); 
++*p; // dereference the pointer and increment the object pointed to 


} 
但 是 , incr_p( ) 突然 不 像 以 前 看 起 来 简单 和 有 了 吸引 力 。 第 5 章 讨论 如 何 处 理 这 个 不 好 的 问题 。 与 
之 相 比 , 引用 (例如 iner_r( ) ) 的 用 户 有 权 假 设 引用 指向 一 个 有 效 的 对 象 。 

如 果 “ 不 传递 任何 东西 ”( 不 传递 对 象 ) 可 以 被 函数 接受 , 那么 我 们 应 该 使 用 指针 人 参数。 注意 ， 
这 并 不 是 针对 递增 操作 的 情况 , 它 需 要 为 p==0 抛 出 一 个 异常 。 

因此 , 实际 的 答案 是 “选择 依赖 于 函数 的 性 质 ”: 

e。 对 于 小 的 对 象 , 倾向 于 传递 值 。 

e 对 于 “没有 对 象 "( 用 0 表示 ) 是 有 效 参 数 的 函数 ， 使 用 一 个 指针 参数 ( 记 着 对 0 进行 测试 ) 。 

。 否则 , 使 用 一 个 引用 参数 。 
参见 8.5.6 节 。 

17. 9.2 指针 、 引 用 和 继承 

在 14. 3 节 中 , 我 们 看 到 一 个 派生 类 (例如 Circle) 如 何 被 用 在 需要 它 的 公有 基 类 Shape 的 对 象 
的 地 方 。 我 们 可 以 用 指针 或 引用 来 表达 这 个 思想 : 由 于 Shape 是 Circle 的 一 个 公有 基 类 , 因此 Cir- 
cle* 可 以 被 强制 转换 为 Shape”。 例 如 : 


void rotate(Shape* s, int n); // rotate *s n degrees 


Shape* p = new Circle(Point(100,100),40); 
Circle c(Point(200,200),50); 
rotate(&c,45); 


对 于 引用 是 类 似 的 : 


void rotate(Shape& s, int n); / rotate s n degrees 


Shape& r= c; 
rotate(c,75); 


这 是 大 多 数 的 面向 对 象 的 编程 技术 的 关键 (参见 14.3 节 和 14.4 节 )。 
17. 9. 3 实例: 列表 
列表 是 最 普通 和 有 用 的 数据 结构 之 一 。 列 表 通 常会 有 一 些 “ 链 接 ”, 每 个 链接 会 保存 一 些 信息 
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和 指向 其 他 链接 的 指针 , 这 是 指针 的 典型 用 途 之 一 。 例 如 , 一 个 短 的 列表 ngrsesgods 可 表示 如 王 ， 
一 个 像 这 样 的 列表 称 为 双向 链表 (doubly-linked list) , 我 们 可 以 在 一 个 链接 上 找到 前 趋 与 后 继 。 一 
个 只 能 找到 后 继 的 列表 称 为 单 向 链表 (singly-linked list) 。 当 我 们 硕 望 很 容易 其 称 险 一 个 元 喜 时 
我 们 可 以 使 用 双向 链表 来 实现 。 我 们 可 以 定义 链接 如 下 : 
struct Link { 

string value; 

Link* prev; 

Link* succ; 

Link(const string& v, Link* p = 0, Link* s = 0) 

: value(v), prev(p), succ(s) { } 





}; 
这 样 , 给 定 一 个 链接 , 我 们 可 以 使 用 suce 指针 到 达 它 的 后 继 , 或 者 使 用 prev 指针 到 达 它 的 前 趋 。 
我 们 使 用 空 指针 来 表示 一 个 没有 后 继 或 前 趋 的 链接 。 我 们 可 以 构造 自己 的 列表 norse_gods 如 下 ; 

Link* norse_gods = new Link("Thor",0,0); 

norse_gods = new Link("Odin", 0, norse_gods); 

norse_gods->succ->prev = norse_gods; 

norse_gods = new Link("Freia",0, norse_gods); 

norse_gods->succ-—>prev = norse_gods; 


我 们 通过 创建 多 个 链接 来 建立 列表 , 并 如 图 中 所 示 将 这 些 链接 连 起 来 : 首先 是 Thor, 然后 0din 是 
Thor 的 前 趋 , 最 后 Freia 是 Odin 的 前 趋 。 你 可 以 跟随 指针 去 查看 我 们 已 经 正确 建立 了 链表 , 这 样 
每 个 后 继 和 前 趋 都 指向 正确 的 位 置 。 但 是 , 这 段 代 码 是 模糊 的 , 这 是 由 于 我 们 没有 显 式 定 义 和 命 
名 一 个 插 人 和 操作: 


Link* insert(Link* p, Link* n)  //insertn before p (incomplete) 
{ 


n 一 >SUcc = p; lp comes after n 
p->prev—->succ = Nn; //n comes after what used to be ps predecessor 
n->prev = p-—>prev; /ps predecessor becomes ns predecessor 
p->prev=n; I/ n becomes ps predecessor 
return ns; 
} 
当 p 确实 指向 一 个 Link, 而 p 指向 的 Link 确实 有 一 个 前 趋 时 ，inser 就 可 以 正确 工作 。 当 我 们 思考 
指针 与 链接 结构 (例如 由 链接 组 成 的 列表 ) 时 , 我们 总 是 用 小 的 带 有 框 和 箭头 的 图 来 验证 代码 对 小 
的 实例 是 否 正确 工作 。 请 不 要 太 骄 傲 , 以 至 于 不 悄 使 用 。 
这 个 版 本 的 insert( ) 是 不 完整 的 , 这 是 由 于 它 没有 处 理 n、p 或 p -> prev 为 0 的 情况 。 我 们 增 
加 适当 的 空 指针 测试 , 得 到 更 苔 条 但 正确 的 版 本 : 
Link* insert(Link* p, Link* n) /insertn before p; return n 
{ 
if (n==0) return p; 
if (p==0) return n; 
n->succ = p; lp comes after n 
if (p=>prev) p—>prev—>succ = nm; 
n->prev = p-—>prev; // p's predecessor becomes ns predecessor 
p->prev= n; Wn becomes ps predecessor 
return n; 


} 


有 了 这 个 insert 函数 , 前文 创建 链表 的 代码 就 可 以 写成 : 
Link* norse_gods = new Link("Thor"); 
norse_gods = insert(norse_gods,new Link("OQdin")); 
norse_gods = insert(norse_gods,new Link("Freia")); 


362 急 三 部 分 ” 仇 据 结 欧 和 彰 法 


现在 所 有 prev 和 succ 指针 易于 引起 的 错误 都 从 我 们 的 视线 中 消失 了 。 指 针 误 用 是 乏味 的 和 容易 
出 错 的 , 即使 是 编写 良好 并 经 过 全 面 测 试 的 函数 中 也 会 存在 。 特 别 是 , 常规 代码 中 的 很 多 错误 是 
由 于 编程 者 忘记 测试 指针 为 0 而 引起 的 , 正如 我 们 (故意 ) 在 insert( ) 的 第 一 个 版 本 中 所 做 的 那样 。 
注意 , 我 们 使 用 默认 的 参数 (参见 15. 3. 1 节 和 附录 A. 9. 2), 使 用 户 不 必 每 次 使 用 构造 函数 时 
都 要 处 理 前 趋 与 后 继 。 
17. 9.4 列表 的 操作 
在 标准 库 中 提供 了 一 个 List 类 , 我 们 将 会 在 20.4 节 中 介绍 它 。 列 表 类 中 隐藏 了 所 有 的 链接 
但 是 这 里 我 们 将 基于 Link 类 详细 说 明 列表 的 概念 ， 以便 查 看 在 列表 类 的 “表面 背后 "的 内 
， 以 及 更 多 有 关 指 针 使 用 的 例子 。 
我 们 的 Link 人 这 在 茶 种 程度 上 视 开发 者 的 偏好 而 
定 , 但 是 这 里 有 一 组 有 用 的 操作 : 
。 构造 隔 数 。 
e insert; 在 一 个 元 素 前 插入。 
e。 add: 在 一 个 元 素 后 插 人 。 
。 erase: 删除 一 个 元 素 。 
find: 查找 一 个 给 定 值 的 Link。 
advance: 获得 第 n 个 后 继 。 
我 们 可 以 像 这 样 编写 这 些 操 作 : 


Link* add(Link* p, Link* n) /insert n after p; return n 


// much like insert (see exercise 11) 


} 
Link* erase(Link* p) // remove *p from list; return p’s successor 
{ 
if (p==0) return 0; 
if (p->sSucc) p->succ->prev = p->prev; 
if (p->prev) p->prev~->sSucc = Pp~>SUCC; 
return p—>succ; 
} 


Link* find(Link* p, const string& s) /findsin list; 
// return 0 for “not found” 


{ 
while(p) { 
if (p->value == $) return p; 
P=p~>succ; 
} 
return 0; 
} 


Link* advance(Link* p, intm) //move n positions in list 
// return 0 for “not found’” 
// positive n moves forward, negative backward 


if (p==0) return 0; 
if (0<n) { 
while (nr 一 ~){ 
if (p~>succ == 0) return 0; 
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p=Pp->succ; : 


} 
if (n<0) { 
While (n++) { 
if (p—>prev == 0) return 0; 
p = Pp->prev; 
} 
} 
return p; 


} 
注意 后 级 n ++ 的 使 用 。 这 种 递增 (后 递增 ) 形 式 在 自身 值 增加 之 前 生成 值 。 
17. 9.5 列表 的 使 用 

作为 一 个 小 的 练习 , 我 们 建立 两 个 列表 : 


Link* norse_gods = new Link("Thor"); 

norse. gods = insert(norse_gods,new Link("Odin")); 
norse_gods = insert(norse_gods,new Link("Zeus")); 
norse_gods = insert(norse_gods,new Link("Freia")); 


Link* greek_gods = new Link("Hera"); 

greek_gods = insert(greek_gods,new Link("Athena")); 
greek_ gods = insert(greek_gods,new Link("Mars")); 
greek_gods = insert(greek_gods,new Link("Poseidon")); 


不 幸 的 是 , 我 们 犯 了 两 个 错误 : Zeus 是 一 位 希腊 的 天 神 , 而 不 是 一 位 北欧 的 天 神 ; 希腊 的 战争 之 


神 是 Ares, 而 不 是 Mars( Mars 是 他 的 拉丁 /罗马 名 字 )。 我 们 可 以 修改 它 : 
Link* p = find(greek_gods, "Mars"); 
if (p) p—>value = "Ares"; 


注意 , 如 何 防止 find( ) 返 回 一 个 0。 我 们 认为 在 这 种 情况 下 它 不 可 能 发 生 ( 我 们 毕竟 只 是 将 Mars 
插入 greek_gods 中 ) ,但 在 实际 的 例子 中 某 些 人 可 能 改变 代码 。 
与 之 相似 , 我 们 可 以 将 Zeus 移 人 正确 的 行列 中 : 


Link* p = find(norse_gods,"Zeus"); 


if (p) + 
erase(p); 
insert(greek_gods,p); 
} 


你 是 否 注 意 到 了 错误 ? 它 相 当 微 妙 (除非 你 直接 使 用 过 链接 )。 如 果 我 们 用 erase( ) 删除 的 链接 是 
由 norse_gods 指向 的 , 会 发 生 什 么 ? 这 种 情况 实际 上 不 会 发 生 , 但 是 为 了 编写 好 的 、 可 维护 的 代 
码 , 我 们 不 得 不 考虑 这 种 可 能 性 。 


Link* p = find(norse_gods, "Zeus'); 
if (p) { 
if (p==norse_gods) norse_gods = p-—>succ; 
erase(p); 
greek_gods = insert(greek_gods,p); 
} 
这 里 我 们 修改 第 二 个 错误 : 当 我 们 在 第 一 个 希腊 天 神 之 前 插入 Zeus 时 , 我 们 需要 让 greek_gods 指 
向 Zeus 的 链接 。 指 针 是 非常 有 用 和 灵活 的 , 但 是 也 是 相当 微妙 的 。 


最 后 , 打印 出 这 个 列表 : 
void print_all(Link* p) 
MH 

cout << '"{"; 

while (p) { 
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cout << p->value; 

if (p=p—>succ) cout << ", "; 
} 
cout << " }"; 


} 


print_all(norse_gods); 
cout<<"\n"; 


print_ali(greek_gods); 
cout<<"\n"; 


将 会 得 到 : 
{ Freia, Odin, Thor } 
{Zeus, Poseidon, Ares, Athena, Hera } 


17. 10 this 指针 


注意 , 在 我 们 的 每 个 列表 函数 中 , 都 使 用 一 个 Link” 作 为 第 一 个 参数 , 并 在 这 个 对 象 中 访问 
数据 。 我 们 经 常 使 用 的 成 员 函 数 来 实现 这 类 函数 。 我 们 是 否 可 以 通过 操作 成 员 来 简化 Link 呢 ? 
我 们 是 否 可 能 使 指针 私有 ,以 便 只 有 成 员 函 数 能 够 访问 它 呢 ? 我们 可 以 的 : 


class Link { 
public: 
string value; 
Link(const string& v, Link* p = 0, Link* s = 0) 
: value(v), prev(p), succ(s) {} 


Link* insert(Link* n) ; / insert n before this object 
Link* add(Link* n) ; / insert n after this object 
Link* erase() ; // remove this object from list 


Link* find(const string& s); /find s in list 
const Link* find(const string& s) const; / find s in list 


Link* advancel(int n) const;  //move n positions in list 
Link* next() const { return succ; } 
Link* previous() const { return prev; } 
private: 
Link* prev; 
Link* succ; 


这 种 方法 看 起 来 很 有 前 途 。 将 那些 不 能 修改 Link 对 象 状 态 的 操作 定义 为 const 成 员 函 数 。 我 们 增 
加 了 两 个 ( 非 修改 性 ) 函数 next( ) 和 previous( ) ， 可 供用 户 遍 历 列表 (链表 ) 。 由 于 已 经 禁止 用 户 直 
接 访问 succ 和 prev, 这 两 个 函数 是 必要 的 。 数 据 值 仍 然 定 义 为 公有 成 员 , 因为 (到 目前 为 止 ) 我 们 
没有 理由 不 这 人 么 做 : 它们 “只 是 数据 而 已 ”。 

现在 我 们 复制 之 前 的 全 局 函数 insert( ) ,进行 适当 的 修改 来 实现 Link :: insert( ) : 


Link* Link: :insert(Link* n) /insert n before p; return n 


{ 
Link* p = this; / pointer to this object 
if (n==0) return p; / nothing to insert 
if (p==0) return n; / nothing to insert into 
n->succ = p; lp comes after n 


if (p—>prev) p—>prev—->succ = nN; 

n->prev=p~>prev; /Pp’spredecessor becomes n’s predecessor 
p->prev= n; ln becomes ps predecessor 

return n; 
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但 是 , 对 于 调用 Link :: insert( ) 的 那个 对 象 , 我 们 如 何 获得 其 指针 呢 ? 没有 程序 设计 语言 的 帮 
助 , 我 们 是 无 法 获得 此 指针 的 。 不 过 , 幸运 的 是 ，C++ 提供 了 相应 的 机 制 : 在 每 个 成 员 函 数 
中 , 标识 符 this 就 是 指向 用 户 调用 成 员 函 数 所 用 对 象 的 指针 。 因 此 , 可 以 简单 地 将 代码 中 的 p 
都 蔡 换 为 this: 


Link* Link::insert(Link* n)  // insert n before this object; return n 


{ 
if (n==0) return this; 
if (this==0) return n; 
n->succ = this; // this object comes after n 
if (this—>prev) this—>prev—>succ = n; 
n->prev = this—->prev; /this object’s predecessor 
/I becomes ns predecessor 
this—>prev = n; /ln becomes this object’s predecessor 
return n; 
} 


这 有 些 哆 嗪 , 但 C++ 提供 了 更 简单 的 语法 ， 当 我 们 访问 当前 对 象 的 成 员 时 ,无 需 再 写 this: 


Link* Link: :insert(Link* n) /Winser n before this object; return n 


{ 
if (n==0) return this; 
if (this==0) return n; 
n->succ=this; /this object comes after n 
if (prev) prev—>succ = n; 
n->prev= prev;  / this object’s predecessor becomes ns ‘predecessor 
prev=n; /ln becomes this objects predecessor 
return n; 
} 


换血 话说 , 只 要 是 在 访问 成 员 , 就 可 以 省 略 指向 当前 对 象 的 指针 this。 只 有 当 需 要 引用 整个 对 象 
时 , 我 们 才 需 要 显 式 使 用 this。 

注意 this 有 特殊 的 意义 : 它 指 向 用 户 调用 成 员 函 数 时 所 用 的 对 象 。 它 不 指向 任何 旧 的 对 象 。 
编译 希 你 证 我 们 在 成 员 函 数 中 不 能 修改 this 的 值 。 例 如 : 


struct S{ 
// ... 
void mutate(S* p) 
{ 
this=p; /error: “this” is immutable 
Hr 


}; 


17. 10. 1 关于 Link 使 用 的 更 多 讨论 
在 处 理 实现 的 细节 之 后 , 我 们 可 以 看 到 使 用 链表 的 新 代码 如 下 : 


Link* norse_gods = new Link("Thor"); 

norse_gods = norse_gods->insert(new Link("Odin")); 
norse_gods = norse_gods~>insert(new Link("Zeus")); 
norse_gods = norse_gods->insert(new Link("Freia")); 


Link* greek_gods = new Link("Hera"); 

greek_gods = greek_gods->insert(new Link("Athena’)); 
greek_gods = greek_gods—>insert(new Link("Mars"')); 
greek_gods = greek_gods~>insert(new Link("Poseidon")); 


它 与 前 面 的 版 本 非常 相似 。 像 前 面 的 例子 一 样 ， 我 们 改正 所 有 的 “错误 ”。 修 改 战 争 之 神 的 名 字 : 


Link* p = greek _gods—>find("Mars"); 
if (p) p->value = "Ares"; 
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将 Zeus 移 到 正确 的 位 置 : 
‘Link* p2 = norse_gods—>find("Zeus"); 
计 (p2){ 
‘if (p2==norse_gods) norse_gods = p2->next(); 
p2->erase(); 
Breek_gods = greek_gods~>insert(p2); 
) , 


最 后 , 打印 出 这 个 列表 : 
void print_all(Link* p) 
| 


cout << "{ "; 
while (p) { 
cout << p~>value; 
if (p=p—->next()) cout << ", "; 
} 
cout << " }"» 
} 
print_all(norse_gods); 
cout<<"\n"; 


print_all(greek_gods); 
cout<<"\n"; 


将 会 得 到 

{ Freia, Odin, Thor } 

{Zeus, Poseidon, Ares, Athena, Hera } 
你 更 喜欢 哪个 版 本 : insert( ) 是 成 员 人 人 它 是 自由 消 数 的 版 本 ?在 这 种 情况 下 ,差别 
并 不 大 , 参见 9.7.5 节 。 

通过 观察 发 现 ， 我 们 仍 没有 一 个 列表 类 ， 只 有 一 个 链接 类 。 这 使 得 我 们 担心 指向 第 一 个 元 素 
的 是 哪个 指针 。 我 们 可 以 通过 定义 一 个 List 类 来 做 得 更 好 , 但 是 | 须 者 这 里 给 出 的 思路 来 设计 是 很 
简单 的 。 在 20. 4 节 中 将 会 介绍 标准 库 list。 


< 简单 练习 


本 章 的 简单 练习 包括 两 个 部 分 。 第 一 部 分 练习 /建立 对 自由 空间 数组 的 理解 , 并 将 数组 与 向 量 加 以 
比较 : 
. 使 用 new 分 配 一 个 由 10 个 int 组 成 的 数组 。 
.使 用 cout 打印 这 10 个 int 的 值 。 
. 使 用 delete[ ] 释放 这 个 数组 。 


编写 一 个 函数 print_array10( ostream& os, int”a), 将 a( 假 设 包含 10 个 元 素 ) 的 值 打印 到 os。 
分 配 一 个 由 10 个 int 组 成 的 数组 ; 用 值 100、101、102 等 初始 化 数组 ; 打印 数组 的 值 。 
分 配 一 个 由 11 个 int 组 成 的 数组 ; 用 值 100、101、102 等 初始 化 数组 ; 打印 数组 的 值 。. 


， 编写 一 个 函数 print_array( ostream& os, int” a, int nm) ， 将 a( 假设 包含 n n 个 元 素 ; 的 值 打印 到 os 。 
. 分 配 一 个 由 20 个 int 组 成 的 数组 ; 用 值 100、 101、102 等 初始 化 数组 ; 打印 数组 的 值 。 
. 你 是 否 记 得 删除 这 个 数组 ? (如果 没有 , 删除 它 。) 
10. 重复 做 第 5、6、8 题 , 使 用 一 个 向 量 来 代替 数组 , 使 用 一 个 print_ vector( ) 来 代替 print- array( ) 。 
”第 二 部 分 集中 在 指针 和 它 与 数组 的 关系 上 。 使 用 来 自 最 后 一 个 练习 的 Print_ 
1. 分 配 一 个 int, 将 它 初始 化 为 7, 并 将 它 的 地 址 分 配给 变量 pl。 
2. 打印 pl 的 值 和 它 指 向 的 int 的 值 。 
3. 分配 一 个 由 7 个 int 组 成 的 数组 ; 将 它 初始 化 为 1、2、4、8 等 将 它 的 地 址 分 配给 全 变量 pb 
4. 打印 p2 的 值 和 它 指 向 的 数组 的 值 。 
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5. 声明 一 个 名 字 为 p3 的 int”, 并 使 用 p2 来 初始 化 它 。 
6. 将 pl 赋值 给 p2。 
7. 将 3 赋值 给 p2。 
8， 打 印 pl 和 p2 的 值 和 它们 指向 的 数组 的 值 。 
9. 释放 所 有 通过 自由 空间 分 配 的 内 存 。 
10. 分 配 一 个 由 10 个 int 组 成 的 数组 ; 将 它 初始 化 为 1、2、4、8 等 ; 将 它 的 地 址 分 配给 变量 pl 。 
11. 分 配 一 个 由 10 个 int 组 成 的 数组 , 并 将 它 的 地 址 赋值 给 变量 p2。 
12. 将 由 pl 指向 的 数组 的 值 复制 到 由 p2 指向 的 数组 。 
13， 重 做 第 10 ~ 12 题 , 使 用 一 个 向 量 来 代替 数组 。 
人 了》 思考 题 
. 为 什么 我 们 需要 元 素数 量 可 变 的 数据 结构 ? 
， 我 们 进行 典型 的 编程 时 , 需要 使 用 哪 4 种 存储 形式 ? 
. 什么 是 自由 存储 ? 它 常用 的 其 他 名 称 是 什么 ” 哪 种 操作 符 支持 它 ? 
. 什么 是 释放 操作 符 , 为 什么 我 们 需要 它 ? 
, 什么 是 地 址 ?在 C++ 中 如 何 控制 内 存 地 址 ? 
， 指 向 一 个 对 象 的 指针 中 包含 什么 信息 ?” 它 缺少 什么 有 用 的 信息 ? 
一 个 指针 可 以 指向 什么 ? 
， 什 么 是 内 存 泄漏 ? 
. 什么 是 资源 ? 
10,， 我 们 如 何 初始 化 一 个 指针 ? 
11. 什么 是 空 指针 ? 我 们 什么 时 候 需 要 使 用 它 ? 
12. 我 们 什么 时 候 需 要 指针 (而 不 是 一 个 引用 或 命名 对 象 )? 
13. 什么 是 析 构 函数 ? 我 们 什么 时 候 需 要 使 用 它 ? 
14. 我 们 什么 时 候 需 要 虚 析 构 函 数 ? 
15. 成 员 如 何 来 调用 析 构 函数 ? 
16. 什么 是 转换 ? 我 们 什么 时 候 需 要 使 用 它 ? 
17, 什么 是 双向 的 列表 ? 

8， 什 么 是 this? 我 们 什么 时 候 和 需要 使 用 它 ? 


~ 术语 
地 址 析 构 函数 指针 地 址 : && 自由 空间 范围 
分 配 链接 资源 泄漏 转换 列表 子 脚本 
容器 成 员 访问 ， -> ” 子 肢 本: [ ] 内 容 :“ 成 员 析 构 郴 数 this 
释放 内 存 类 型 转换 delete 内 存 泄 漏 虚 析 构 郴 数 
delete[ ] new void 解 引 用 空 指 针 

他》 习题 


1. 什么 是 你 的 实现 中 的 指针 值 的 输出 形式 ? 提示: 不 要 阅读 相关 文档 。 

2. 一 个 int 占 多 少 字 节 ? double 呢 ? bool 呢 ? 不 要 使 用 sizeof, 除非 你 要 验证 自己 的 答案 。 

3. 编写 一 个 函数 void to_lower(char”s), 在 C 风格 的 字符 串 s 中 用 对 应 的 小 写字 符 替 换 所 有 大 写字 符 。 例 
如 ,，“Hello，World!1" 替换 为 “hello, world!1”。 不 要 使 用 任何 的 标准 库 沙 数 。C 风格 的 字符 串 是 一 个 由 0 结 
东 的 字符 数组 ,因此 在 结尾 你 会 发 现 一 个 值 为 0 的 字符 。 

4. 编写 一 个 函数 char”strdup( const char” ) , 将 C 风格 的 字符 串 复制 到 自由 分 配 的 内 存 中 。 不 要 使 用 任何 的 
标准 库 函 数 。 
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. 编写 一 个 函数 char”findx( const char”s, const char”x) , 在 C 风格 的 字符 串 s 中 找到 字符 串 x 首次 出 现 的 
位 置 。 

. 本 章 没 有 说 明 当 你 使 用 new 用 尽 内 存 时 会 发 生 什 么 。 这 种 情况 称 为 内 存 耗 尽 。 请 弄 清 将 会 发 生 什 么 。 你 
有 两 个 明确 的 选择 : 查找 文档 或 编写 一 个 用 无 限 循 环 分 配 内 存 但 不 释放 的 程序 。 两 者 都 尝试 一 下 , 估计 
你 在 失败 之 前 分 配 了 多 少 内 存 ? 

， 编写 一 个 程序 使 用 cin 将 字符 读 取 到 自由 存储 的 数组 。 读 取 每 个 字符 直到 输入 惊叹 号 (!) 为止 。 不 要 使 
用 std:: string 也 不 要 担心 内 存 耗 尽 。 


8. 重新 做 练习 7, 这 次 读 取 到 std :: string, 而 不 是 自由 存储 的 数组 (string 知道 如 何 使 用 自由 存储 ) 。 


9. 


10. 


堆栈 采用 哪 种 方式 : 向 上 (趋向 高 地 址 ) 或 向 下 (趋向 低地 址 )? 自由 存储 最 初 (在 使 用 delete 之 前 ) 是 如 何 
生长 的 ? 编写 程序 来 找到 答案 。 


查看 你 对 练习 7 的 解决 方案 。 输 入 是 否 会 使 数组 溢出 ?也 就 是 说 , 你 是 否 能 输入 比分 配 的 数组 空间 更 多 
的 字符 (一 个 严重 的 错误 )? 如 果 你 试图 输入 超过 分 配 空 间 的 字符 时 , 将 会 发 生 什么 合理 的 现象 ? 查看 
realloc( ) 并 使 用 它 来 扩大 你 分 配 的 空间 。 


. 完成 17. 10. 1 节 中 的 天 神 的 列表 例子 并 运行 它 。 
， 为 什么 我 们 要 年 义 两 个 版 本 的 find( )? 
. 修改 17. 10. 1 节 中 的 Link 类 以 保存 struct Cod 的 值 。struct God 包含 string 类 型 的 成 员 : 姓名、 神话、 坐骑 


工具 和 武器 。 例 如 ,God(“Zeus”, “Greek”,“”, “lightning”) 和 God(“Odin”, “Norse”,“ Eight-legged 
flying horse called Sieipner ,“”) 。 编 写 一 个 郴 数 print_all( ) , 每 行列 出 一 个 天 神 的 属性 。 添 加 一 个 成 员 
肾 数 add_ordered( ) , 将 新 的 元 素 放置 在 正确 的 位 置 。 使 用 God 类 型 的 值 作为 链接 ,建立 来 自 三 个 神话 
的 天 神 列表 ; 然后 将 元 素 ( 天神) 从 这 个 列表 移 到 相应 的 列表 中 , 每 个 列表 对 应 于 一 个 神话 。 


. 是 否 可 以 使 用 单 向 列表 来 实现 17. 10. 1 节 中 的 天 神 的 列表 例子 ? 我 们 是 否 可 以 将 prev 成 员 排 除 在 Link 


之 外 ? 为 什么 我 们 希望 这 样 做 ? 哪 种 例子 有 利于 理解 单 向 链表 的 使 用 ? 只 使 用 单 问 链表 来 重新 实现 这 
个 例子 。 


一》 附 言 


我 们 可 以 简单 地 使 用 向 量 ， 为 什么 还 要 困扰 于 指针 和 自由 空间 这 样 杂乱 的 、 低 层次 的 东西 呢 ? 好 的 , 答 


案 是 有 些 人 设计 和 实现 了 向 量 与 类 似 的 抽象 , 而 我 们 希望 知道 它 是 如 何 工作 的 。 由 于 有 些 编程 语言 并 不 提 
供 等 同 于 指针 的 功能 ,因此 就 将 这 个 问题 留 给 低层 的 编程 。 基 本 上 , 这 些 语 言 的 程序 员 将 对 硬件 的 直接 访 
问 任务 交 给 C++ 程序 员 或 其 他 适 于 低层 编程 的 语言 的 程序 员 ) 。 我 们 最 喜欢 的 理由 是 简单 的 , 你 实际 上 不 
可 能 说 自己 了 解 计算 机 ， 直 到 你 知道 软件 如 何 适 应 硬件 的 道理 。 那 些 不 知道 指针 、 内 存 地 址 等 的 人 , 经 常会 
对 编程 语言 的 特性 是 如 何 工 作 的 有 一 些 奇 怪 的 想法 , 这 种 错误 的 想法 会 导致 代码 成 为 ”有趣 的 糟糕 代码 " 。 
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“ 买 者 自 慎 !1” 
一 一 忠告 
本 章 将 阐述 如 何 通过 下 标 复制 及 访问 向 量 。 为 此 , 我 们 将 讨论 一 般 的 复制 技术 , 并 讨论 向 量 
类 型 与 数组 的 低层 描述 之 间 的 关系 起 来 。 本 章 将 阐述 数组 与 指针 之 间 的 关系 以 及 其 使 用 引发 的 
一 些 问 题 。 本 章 还 将 讨论 对 于 向 量 类 型 必 不 可 少 的 5 种 操作 : 构造 、 默 认 构 造 、 找 贝 构造 、 拷 贝 赋 
值 以 及 析 构 。 


18.1 介绍 


为 了 能 够 在 蓝天 中 先 翔 , 一 架 飞 机 首先 需要 在 跑道 上 加 速 直 至 它 的 速度 足以 摆脱 地 球 的 引 
力 。 当 飞机 在 跑道 上 前 进 时 ， 它 就 像 是 一 辆 特别 尝 重 的 、 丑 陋 的 大 卡车 ; 而 一 旦 飞机 飞 上 了 和 天空， 
它 就 会 立刻 变 成 一 种 完全 不 同 的 、 优雅 的 、 高 效 的 交通 工具 一 一 这 才 是 它 的 真正 本 领 。 

在 本 章 中 , 我 们 首先 将 学 习 编 程 语言 的 一 些 特性 与 技术 ,以 使 得 我 们 能 够 摆脱 直接 管理 底层 
内 存 空间 所 带 来 的 困难 和 束缚 。 我 们 试图 实现 如 下 目标 : 当 在 编程 中 产生 某 些 逻辑 需求 时 , 我 们 
能 够 使 用 某 些 类 型 准确 地 实现 逻辑 需求 的 所 有 功能 。 而 为 了 实现 这 一 目标 , 我 们 首先 需要 解决 很 
多 与 计算 机 访问 有 关 的 基本 限制 , 例如 : 

。 一 个 对 象 在 内 存 中 的 大 小 是 固定 的 。 

。 一 个 对 象 存 放 在 内 存 中 的 某 一 特定 位 置 。 

e。 计算 机 只 为 该 对 象 提 供 了 有 限 的 基本 操作 (如 拷贝 一 个 字 、 将 两 个 字 中 的 值 相 加 , 等 等 ) 。 

本 质 上 来 说 ， 上述 的 这 些 限 制 只 针对 C++ 的 基本 数据 类 型 与 操作 (继承 自 C 语言 ; 参见 
22.2. 5 节 和 第 27 章 ) 。 在 第 17 章 , 我 们 已 经 使 用 过 了 vector 类 型 。vector 类 型 能 够 控制 所 有 对 它 
的 元 素 的 访问 , 并 且 它 提供 了 一 些 从 用 户 角度 看 来 “很 自然 ”的 操作 。 

本 章 将 着 重 介绍 拷贝 这 一 概念 。 这 是 一 个 重要 的 技术 问题 ; 对 一 个 对 象 进行 拷贝 意味 着 什 
么 ” 当 拷 贝 操作 发 生 后 , 主体 与 副本 之 间 的 独立 程度 如 何 ? 有 几 种 拷贝 操作 ? 我 们 如 何 指定 使 用 
哪 种 拷贝 操作 ? 拷贝 操作 与 其 他 基本 操作 (例如 初始 化 和 清理 ) 之 间 有 什么 关系 ? 

当 不 能 使 用 高 层次 的 类 型 (如 vector 和 string) 时 ,我 们 会 不 可 避免 地 需要 讨论 程序 是 如 何 使 
用 内 存 的 。 我 们 需要 清楚 数组 与 指针 之 间 的 关系 、 它 们 的 用 法 以 及 使 用 中 容易 犯 的 错误 , 而 这 些 
信息 对 于 每 一 个 使 用 C++ 或 C 进行 编程 的 人 而 言 是 十 分 重要 的 。 

我 们 在 学 习 的 过 程 中 应 留意 vector 类 型 对 vector 对 象 的 独特 性 以 及 C++ 在 低层 类 型 基础 上 构 
建 高 层 类 型 的 方法 。 然 而 , 在 每 种 语言 中 ,“ 高 层 ” 类 型 ( string、vector、list、map 等 ) 是 通过 相同 的 
计算 机 原 语 构建 的 , 并 反映 了 对 我 们 在 本 章 中 所 描述 问题 的 多 种 解法 。 


18.2 拷贝 
如 第 17 章 中 所 示 , 我 们 的 vector 类 型 具有 如 下 形式 : 


class vector { 
int sz; // the size 
double* elem; //a pointer to the elements 
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public: 
vector(int s) Hf constructor 
:sz(S), elem(new double[s]) {} // allocates memory 
~Vvector() 1// destructor 
{ delete[] elem; } // deallocates memory 


并 
}; 


让 我 们 试图 拷贝 其 中 的 一 个 向 量 : 


void f(int n) 
{ 
‘vector v(3); // define a vector of 3 elements 
VSet(2,2.2); jsetvl2jto22 
Vector v2=v;  //whathappens here? 


下 
} 


理想 情况 下 , 问 量 对 象 凡 成 为 向 量 对 象 v 的 一 个 副本 ( 即 ” = "意味 着 拷贝 ); 也 就 是 说 , 对 于 所 有 
位 于 区 间 [0: v. size( ) ) 内 的 整数 i 而 言 , v2. size( ) ==v. size( ) 且 v2[i] ==vLi]。 并 且 , 对 象 2 
与 v 所 占用 的 内 存 将 在 函数 f( ) 结 束 时 被 系统 收回 。 上 述 操作 是 标准 库 的 vector 类 型 所 完成 的 操 
作 , 而 非 我 们 的 vector 类 型 所 完成 的 操作 。 我 们 的 任务 是 完善 我 们 的 vector 类 型 使 之 能 够 正确 完 
成 上 述 操作 。 在 此 之 前 , 首先 需要 清楚 我 们 目前 的 vector 类 型 都 实现 了 什么 操作 。 准 确 地 说 ， 目 
前 的 vector 类 型 做 错 了 什么 ? 如 何 做 错 的 ?为 什么 会 做 错 ? 一 旦 找 出 了 错误 所 在 , 那么 我 们 就 很 
可 能 可 以 解决 这 些 错误 , 并 能 在 以 后 的 编程 中 避免 再 犯 类 似 的 错误 。 

对 于 一 种 类 型 而 言 , 拷贝 的 默认 含义 是 “拷贝 所 有 的 数据 成 员 ”。 例 如 , 我 们 拷贝 一 个 Point 
对 象 意味 着 我 们 需要 拷贝 这 一 对 象 所 包含 的 坐标 数据 。 但 对 于 指针 成 员 而 言 , 仅仅 对 指针 成 员 进 
行 拷贝 会 产生 问题 。 以 例子 中 的 vector 对 象 为 例 ， 当 撕 贝 发 生 后 ， v. SZ == V2. sz Hv. elem == v2. 
elem。 因 此 , 我 们 的 vector 对 象 会 具有 如 下 形式 : 
也 就 是 说 , 对 象 v2 并 没有 拥有 对 象 v 的 成 员 副本 ; 它 仅仅 去 学 了 ， 的 成 员 。 el 
代码 : v: 国人 2 a ee 

v.Set(1,99); W set v[1] to 99 


v2.set(0,88); / set v2[0] to 88 vy2: 
cout << v.get(0) << '' << v2.get(1); 


这 有 段 代 码 将 会 输出 88 99, 这 不 是 我 们 想 要 的 结果 。 如 果 对 象 v 与 对 象 v2 之 间 完 全 独立 , 由 于 我 
们 没有 向 vL0] 或 vL1] 写 入 数据 , 因此 代码 应 输出 0 0。 你 可 能 会 认为 我 们 现在 所 实现 的 操作 是 
“有 趣 的 "、“ 简 洁 的 ”或 有 用 的 ”, 但 这 不 是 我 们 想 要 的 , 或 者 不 是 标准 库 的 vector 类 型 所 提供 的 
操作 。 并 且 , 这 些 操 作 将 不 可 避免 地 会 导致 函数 f( ) 返 回 时 发 生 错 误 : 对 象 v 与 v2 的 析 构 函数 将 
被 隐 式 调用 ; 对 象 y 的 析 构 函数 会 通过 如 下 语句 释放 向 量 元 素 所 占用 的 内 存 : 


delete[] elem; 
而 之 后 对 象 v2 的 析 构 函数 也 将 完成 同样 的 操作 。 对 于 对 象 * 与 2 而 言 , 由 于 指针 elem 指向 同一 
块 内 存 , 因此 重复 两 次 释放 这 一 块 内 存 将 会 造成 灾难 性 的 后 果 ( 参 见 17. 4.6 节 )。 
18.2.1 拷贝 构造 函数 

那么 , 我 们 应 该 怎么 做 呢 ? 我 们 需要 显示 地 进行 拷贝 操作 ， 当 用 一 个 vector 对 象 初始 化 另 一 
个 vector 对 象 时 , 应 拷贝 所 有 的 向 量 元 素 并 且 保 证 这 一 拷贝 操作 确实 被 调用 了 。 

某 一 类 型 的 对 象 的 初始 化 是 由 该 类 型 的 构造 函数 实现 的 。 所 以 , 为 实现 拷贝 操作 , 我 们 需要 实 
现 一 种 特定 类 型 的 构造 函数 。 这 种 类 型 的 构造 函数 称 为 找 贝 构造 函数 。C++ 定义 拷贝 构造 函数 的 参 
数 应 该 为 一 个 对 被 拷贝 对 象 的 引用 。 因 此 , 对 于 类 型 vector 而 言 , 它 的 拷贝 构造 函数 为 如 下 形式 : 
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vector(const vector&); 

这 一 拷贝 构造 函数 将 在 我 们 试图 使 用 一 个 vector 对 象 初始 化 另 一 个 vector 对 象 时 被 调用 。 拷 
贝 构造 函数 使 用 对 象 引用 作为 参数 的 原因 在 于 我 们 不 希望 在 传递 函数 参数 时 又 发 生 参 数 的 拷贝 ， 
而 使 用 const 引用 的 原因 在 于 我 们 不 希望 函数 对 参数 进行 修改 (参见 8.5.6 节 )。 因 此 , 我 们 按 如 
下 形式 重新 定义 vector 类 型 : 


class vector { 
int sz; 
doubie* elem; 
void copy(const vector& arg);  //copy elements from arg into *elem 
public: 
vector(const vector&) ; /copy constructor define copy 
人 
}»; 


葬 数 copy( ) 简单 拷贝 参数 (一 个 向 量 ) 的 所 有 元 素 : 


void vector: :copy(const vector& arg) 
/copy elements [0:arg.sz—1] 


for (int i= 0; i<arg.sz; ++i) elem[{i] = arg.elem[i]; 

} 
类 型 vector 的 成 员 函 数 copy( ) 假 设 在 参数 对 象 arg 以 及 拷贝 的 目标 对 象 中 都 包含 了 sz 个 元 素 。 为 
了 保证 这 种 情况 的 正确 性 , 我 们 将 函数 copy( ) 实现 为 类 型 vector 的 私有 函数 。 只 有 类 型 vector 的 
成 员 消 数 才 能 够 调用 了 滑 数 copy( ) ， 而 这 些 函 数 需 要 确保 参数 arg 与 拷贝 的 目标 对 象 的 大 小 相 
匹配 。 

在 拷贝 参数 对 象 之 前 , 拷贝 构造 阴 数 设置 了 目标 对 象 所 包含 元 素 的 数目 (sz) 并 为 元 素 分 配 内 
存 ( 初始 化 elem ) : 


vector:: vector(const vector& arg) 

// allocate elements, then initialize them by copying 
:sz(arg.sz), elem(new double[larg.sz]) 

{ 
copy(arg); 


给 定 这 一 拷贝 构造 函数 , 再 回 到 我 们 的 例子 : 


Vectorv2 = v; 
这 一 定义 语句 将 会 通过 如 下 方式 实现 对 象 v2 的 初始 化 : 调用 类 型 vector 的 拷贝 构造 函数 并 将 对 象 
v 作为 函数 的 参数 。 假 设 对 象 v 具有 三 个 元 素 , 则 我 们 通过 拷贝 可 以 得 到 : 





因此 , 调用 对 象 v 与 2 的 析 构 函数 时 不 会 产生 错误 ,对 象 * 与 2 中 元 素 集 合 所 占用 的 内 存 都 将 
被 正确 地 释放 。 可 以 看 出 , 拷贝 构造 函数 使 对 象 v 与 v2 相互 独立 , 因此 我 们 可 以 在 不 影响 其 中 一 
个 对 象 的 元 素 的 前 提 下 改变 另外 一 个 对 象 的 元 素 。 例 如 : 


V.Set(1,99)， /set v[1j to 99 
v2.set(0,88); // set v2[0} to 88 
cout << v.get(0) << '' << v2.get(1); 


这 段 代码 将 输出 0 0。 
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除了 通过 如 下 语句 之 外 
vector v2 = V; 

我 们 还 可 以 通过 如 下 形式 实现 对 象 v2 的 初始 化 
Vector v2(V); 


当 对 象 v( 初 始 化 值 ) 与 对 象 2 (被 初始 化 变量 ) 属于 同一 类 型 并 且 该 类 型 定义 了 拷贝 函数 时 , 则 这 
两 种 初始 化 方式 完全 相同 。 读 者 可 以 选择 自己 喜欢 的 方式 进行 对 象 初始 化 。 
18. 2.2 拷贝 赋值 

我 们 可 以 通过 构造 函数 找 贝 (初始 化 ) 对 象 , 但 我 们 也 可 以 通过 赋值 的 方式 进行 vector 对 象 的 
找 贝 。 与 拷贝 初始 化 类 似 , 拷贝 赋值 默认 只 进行 对 象 成 员 的 拷贝 。 因 此 , 对 于 我 们 目前 定义 的 
vector 类 型 而 言 , 拷贝 赋值 会 造成 数据 重复 删除 (如 18. 2. 1 节 中 的 拷贝 构造 函数 所 示 ) 以 及 内 存 泄 
漏 等 问题 。 例 如 : 


void f2(int nm) 
{ 
vector v(3); // define a vector 
Vv,.Set(2,2.2); 
Vector v2(4); 
V2=vV; 1/ assignment: what happens here? 
ll... 
} 


我 们 希望 对 象 v2 成 为 对 象 v 的 副本 (标准 库 的 vector 类 型 按 这 种 方式 实现 ), 但 由 于 我 们 并 未 定义 
vector 类 型 的 拷贝 赋值 操作 , 因此 将 执行 默认 的 拷贝 赋值 操作 ， 即 赋值 操作 将 进行 成 员 拷贝 。 因 
此 , 对 象 V2 的 成 员 sz、elem 与 对 象 v 的 成 员 sz、elem 完全 相同 ， 如 下 图 所 示 : 
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当 消 数 介 ( ) 结 束 时 , 程序 将 会 产生 与 18. 2 节 一 样 的 错误 : 被 对 象 v 与 v2 共同 指向 的 向 量 元 
素 将 锌 释放 两 次 (使 用 delete[ ] ) 。 另 外 , 还 会 发 生 内 存 泄漏 现象 ; 对 象 v2 的 4 个 元 素 所 占用 的 内 
存 空间 没有 被 释放 。 对 拷贝 赋值 操作 的 改进 本 质 上 与 对 拷贝 初始 化 的 改进 ( 见 18. 2. 1 节 ) 完全 相 
同 。 我 们 应 按 如 下 方式 定义 拷贝 赋值 操作 : 


class vector { 

int sz; 

double* elem; 

void copy(const vector& arg);  //copy elements from arg into *elem 
public: 

vector& operator=(const vector&) ;  //copy assignment 

1... 
}; 


vector& vector: :operator=(const vector& a) 
// make this vector a copy of a 
{ 
double* p= new doubje[a.sz]; //allocate new space 
for (int i = 0; i<a.sz; ++i)pli] = a.elem[lil; /copy elements 
delete[] elem; // deallocate old space 


elem = p; // now we can reset elem 
SZ = a.SZ; 
return *this; // return a self-reference {see §17.10) 
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由 于 拷贝 赋值 操作 需要 考虑 对 一 个 对 象 原 有 元 素 的 处 理 , 因此 拷贝 赋值 揉 作 且 挝 贝 构造 操作 
稍微 复杂 一 些 。 我 们 的 基本 策略 是 从 源 vector 对 象 拷贝 所 有 的 元 素 : 

double* p = new double[a.sz]; /allocate new space 

for (int i = 0; ica.sz; ++i)p[i] = a.elem[i]; 


然后 , 我 们 将 释放 目标 vector 对 象 的 原 有 元 素 : 


delete[] elem; 1 deallocate old space 
最 后 , 我 们 将 elem 指向 新 元 素 ;: 
elem = p; I now we can reset elem 
5 三 站 
操作 的 结果 如 下 图 所 示 : 
v | 使 用 delete[] 将 内 存 空间 
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现在 , 我 们 的 vector 类 型 已 不 存在 内 存 泄漏 以 及 内 存 重复 释放 (delete [ ]) 问 题 了 。 

在 实现 拷贝 赋值 操作 时 , 我 们 可 以 在 创建 副本 之 前 首先 释放 原 有 元 素 所 占用 的 内 存 以 简化 代 
码 , 但 这 不 是 一 个 好 的 做 法 。 更 好 的 做 法 是 , 我 们 应 一 直 保留 原 有 元 素 直到 我 们 确信 和 原 有 元 素 能 
够 被 安全 地 释放 。 如 果 我 们 不 这 么 做 , 那么 在 将 一 个 对 象 赋值 给 它 目 喘 时 将 有 可 能 会 产生 奇怪 的 
结果 : 


Vector v(10); 
v=v; /self-assignment 


请 仔细 检查 我 们 的 实现 ， 以 保证 它 能 够 正确 地 处 理 这 种 情况 (不 考虑 性 能 是 否 最 优化 ) 。 
18. 2.3 拷贝 术语 


对 于 大 多 数 的 程序 以 及 编程 语言 而 言 , 拷贝 带 来 了 很 多 的 问题 。 TE 该 拷贝 
一 个 指针 (或 引用 ) 还 是 应 该 拷贝 指针 指向 (或 引用 ) 的 数据 : 
。 浅 拷贝 只 拷贝 指针 ,因此 两 个 指针 可 能 指向 同一 个 对 象 。 
。 深 拷 贝 将 拷贝 指针 指向 的 数据 ,因此 两 个 指针 将 指向 两 个 不 同 的 对 象 。 例 如 ，veetor 类 型 
与 string 类 型 都 实现 了 深 拷贝 。 当 我 们 需要 为 某 一 类 型 的 对 象 实现 深 拷 贝 时 , 我 们 需要 显 
式 地 为 该 类 型 定义 自己 的 拷贝 构造 函数 与 拷贝 赋值 函数 。 
下 面 是 一 个 浅 拷贝 的 例子 : 


int* p = new int(77); 
int*q=p; /copy the pointer p 
*p= 88; I/ change the value of the int pointed to by p and q 


浅 拷贝 的 操作 如 右 图 所 示 。 与 之 相对 应 的 是 , 我 们 也 可 以 执行 深 找 贝 
ene a // allocate a new int, then copy the value pointed to by p 
*p = 88; 1 change the value of the int pointed to by p 

深 拷贝 的 操作 如 右 图 所 示 。 通 过 拷贝 术语 可 以 看 出 , 我 们 原来 的 vector 类 . 

型 产生 问题 的 根源 在 于 它 只 实现 了 浅 拷贝 而 不 是 拷贝 指针 elem 指向 的 “* 国 国 

元 素 。 与 标准 库 的 vector 类 型 相似 , 改进 版 的 vector 类 型 实现 了 深 拷 贝 : 

它 为 元 素 分 配 新 的 内 存 空 间 并 进行 元 素 的 拷贝 。 实 现 了 浅 拷贝 的 类 型 (如 
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指针 与 引用 ) 称 为 具有 指针 语义 或 引用 语义 (它们 拷贝 地 址 )。 实 现 了 深 拷贝 的 类 型 (如 string 类 型 
和 vector 类 型 ) 称 为 具有 值 语义 (它们 拷贝 指向 的 值 )。 从 用 户 的 角度 看 来 , 具有 值 语义 类 型 的 拷 
贝 操作 就 像 没 有 涉及 指针 一 样 一 一 仅仅 只 有 值 被 拷贝 了 。 也 可 以 说 , 在 进行 拷贝 操作 时 ， 具有 值 
语义 的 类 型 表现 得 就 好 像 它 自己 是 整数 类 型 一 样 。 


18. 3 必要 的 操作 


在 学 习 了 前 几 节 的 知识 之 后 , 现在 我 们 可 以 讨论 如 何 决定 一 个 类 型 应 选择 哪些 构造 函数 、 该 
类 型 是 否 应 定义 析 构 函数 、 类 型 是 否 应 定义 拷贝 赋值 吗 数 这 些 问题 了 。 本 节 我 们 将 考虑 以 下 5 种 
必要 的 操作 : 

。 具有 一 个 或 多 个 参数 的 构造 函数 

。 默认 构造 函数 

。 拷贝 构造 晒 数 (拷贝 同一 类 型 的 对 象 ) 

。 拷贝 赋值 孙 数 (拷贝 同一 类 型 的 对 象 ) 

。 析 构 函数 

通常 , 我们 需要 一 个 或 多 个 构造 函数 以 采用 不 同 的 参数 实现 对 象 初始 化 。 例 如 : 


string s("Triumph"); // initialize s to the character string "Triumph" 
vector<double> v(10); / make v a vector of 10 doubles 


初始 值 的 含义 /用 途 完全 取决 于 构造 函数 。 标 准 string 类 型 的 构造 函数 使 用 一 个 字符 串 作 为 初始 
值 , 而 标准 vector 类 型 的 构造 函数 使 用 一 个 整数 作为 向 量 元 素数 目的 初始 值 。 通 常 我 们 使 用 构造 
函数 来 建立 不 变 式 ( 参 见 9. 4.3 节 ) 。 如 果 我 们 不 能 定义 一 个 类 的 构造 函数 能 够 建立 的 好 的 不 变 
式 , 那么 很 可 能 我 们 使 用 了 一 个 糟糕 的 类 设计 或 者 简单 的 数据 结构 。 

具有 参数 的 构造 函数 的 形式 随 它们 所 在 类 型 的 不 同 而 不 同 。 而 与 之 相 比 , 其 他 的 操作 则 具有 
更 加 规则 的 形式 。 

我 们 如 何 知 道 一 个 类 型 是 否 需 要 默认 构造 函数 呢 ? 如 果 我 们 希望 在 不 指定 初始 值 的 前 提 下 
构造 该 类 型 的 对 象 , 那么 该 类 型 就 需要 默认 构造 函数 。 最 常见 的 例子 是 我 们 希望 将 某 一 类 型 的 对 
象 存放 在 标准 库 的 vector 对 象 之 中 。 下 面 的 这 些 代码 是 正确 的 , 因为 我 们 为 类 型 int、string 和 vec- 
tor < int > 设置 了 默认 值 : 


vector<double> vi(10)， / vector of 10 doubles, each initialized to 0.0 
vector<string> vs(10); // vector of 10 strings; each initialized to ™ 
vector<vector< int> > vvi(10); // vector of 10 vectors, each initialized to vector() 


因此 , 默认 构造 阴 数 常常 是 有 用 的 。 问 题 现在 变 为 :“ 何 时 拥有 一 个 默认 构造 函数 是 有 意义 的 ?” 
一 个 答案 是 :“ 当 我 们 可 以 为 类 的 不 变 式 设 定 一 个 有 意义 或 者 显然 的 默认 值 的 时 候 ”。 对 于 值 类 
型 , 如 int 和 double， 显 然 的 默认 值 为 0( 对 于 double, 为 0.0) 。 对 于 string 类 型 ,默认 值 为 空 字 符 
串 “”, 这 也 是 显然 的 。 对 于 vector 类 型 ， 默认 值 为 空 向 量 。 对 于 类 型 T 而 言 ， 当 软 认 值 存 在 时 ， 
则 了 T() 为 类 型 T 的 默认 值 。 例 如 ，double( ) 为 0.0、string( ) 为 “”, vector < int > () 为 具有 int 类 型 
元 素 的 空间 量 。 

如 果 一 个 类 型 需要 获取 系统 资源 , 则 该 类 型 需要 析 构 函数 。 由 于 系统 的 资源 是 有 限 的 ,因此 
当 我 们 对 资源 使 用 完毕 时 , 应 将 资源 返回 给 系统 。 例 如 , 我 们 可 以 通过 使 用 new 获得 内 存 资源 ， 
而 应 通过 使 用 delete 或 者 delete[ ] 将 获得 的 内 存 资源 释放 。 我 们 实现 的 vector 类 型 需要 获得 内 存 
资源 以 保存 它 的 元 素 , 并 在 使 用 完毕 后 将 资源 释放 ,因此 vector 类 型 需要 实现 析 构 函数 。 其 他 类 
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型 的 资源 包括 文件 (如 果 你 打开 了 一 个 文件 , 则 你 需要 负责 将 它 关 闭 ) 、 锁 、 线 程 句柄 以 及 套 接 字 
(用 于 计算 机 或 进程 间 的 通信 )。 z 

类 型 需要 析 构 函数 的 另 一 个 特征 是 该 类 型 具有 指针 成 员 或 引用 成 员 。 如 果 一 个 类 型 具有 指 
针 成 员 或 引用 成 员 , 则 该 类 型 通常 需要 实现 析 构 函数 以 及 拷贝 操作 。 

通常 ， 一 个 实现 了 析 构 函数 的 类 型 同时 也 需要 实现 找 贝 构造 函数 与 拷贝 赋值 函数 。 其 原因 委 
简单, 如 果 该 类 型 的 一 个 对 象 获 取 了 资源 (或 者 具有 指向 痪 源 的 指针 成 员 ), 那么 只 进行 默认 拷贝 
( 浅 找 贝 ) 几乎 肯定 会 带 来 错误 。 vector 类 型 就 是 一 个 典型 的 例子 。 

另外 ,对 于 一 个 基 类 而 言 ， 如 果 它 的 派生 类 具有 析 构 函数 ， 则 该 交 基 类 的 析 构 函数 应 为 虚 函 数 
(参见 17.5.2 节 )。 
18. 3.1 显示 构造 函数 

只 具有 一 个 参数 的 构造 函数 定义 了 一 个 从 其 参数 类 型 向 该 函数 所 属 类 型 的 转换 。 这 种 转换 

是 十 分 重要 的 。 例 如 : 


class complex { 

public: 
complex(double); //defines double-to-complex conversion 
complex(double,double); 
Wa 

}; 


complex z1=3.14;  //OK: convert 3.14 to (3.14,0) 

complex z2 = complex(1.2, 3.4); 
尽管 如 此 , 我 们 应 谨慎 地 使 用 隐 式 转换 ,因为 隐 式 转换 可 能 会 造成 不 可 预料 的 后 果 。 例 如 , 我 们 
目前 实现 的 vector 类 型 定义 了 一 个 采用 int 类 型 参数 的 构造 函数 。 这 意味 着 这 一 构造 函数 定义 了 
一 个 从 int 类 型 向 veetor 类 型 的 转换 。 例 如 : 


class vector { 
1/ . .. 
vector(int); 
1/... 
}; 
vector v = 10; // odd: makes a vector of 10 doubles 
v= 20; // eh? Assigns a new vector of 20 doubles to v 


void f(const vector&); 
f(10); // eh? Calls f with a new vector of 10 doubles 


看 起 来 好 像 我 们 获得 的 东西 比 预 料 中 的 更 多 。 幸 运 的 是 , 我 们 能 够 通过 一 种 简单 的 方式 禁止 将 构 
造 函 数 用 于 类 型 的 隐 式 转换 。 由 关键 字 explicit 修饰 的 构造 函数 ( 即 显 式 构造 函数 ) 只 4 能 用 于 对 象 
的 构造 而 不 能 用 于 隐 式 转换 。 例 如 : 


class vector { 
1 
expiicit vector(int); 
1/ ... 
)}; 
vector v = 10; / error: no int-to-vector conversion 
v= 20; // error: no int-to-vector conversion 


vector v0(10); /OK 


void f(const vector<double>&); 
f(10); /f error: no int-to-vector<double> conversion 
f(vector<double>{(10)); // OK 
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为 了 避免 意外 的 类 型 转换 , 在 我 们 (以 及 标准 ) 和 定义 的 vector 类 型 中 , 具有 一 个 参数 的 构造 函数 都 
是 显 式 构造 函数 。 遗 憾 的 是 构造 函数 默认 是 非 显 式 的 ; 当 我 们 拿 不 定 主意 时 ,我们 最 好 将 所 有 的 
具有 一 个 参数 的 构造 孙 数 定义 为 显 式 构造 响 数 。 
18. 3.2 调试 构造 函数 与 析 构 函数 

在 程序 的 执行 过 程 中 , 构造 函数 与 析 构 函数 都 将 在 明确 的 、 可 预计 的 时 间 点 上 被 调用 。 尽 管 
如 此 , 我 们 并 不 是 总 是 需要 采用 显 式 的 方式 来 调用 这 些 肾 数 ， 如 vector(2) 。 我 们 在 做 某 些 事 的 时 
候 也 会 调用 这 些 了 水 数 , 例如 声明 一 个 vector 对 象 ,以 传 值 方式 传递 一 个 vector 对 象 参数 , 或 者 使 用 
new 创建 vector 对 象 。 构 造 函 数 与 析 构 函数 的 调用 可 能 会 造成 人 们 对 语法 的 混淆 。 下 面 是 常见 的 
构造 函数 与 析 构 函数 被 调用 的 场合 : 

。 每 当 类 型 X 的 一 个 对 象 被 构建 时 , 类 型 X 的 一 个 构造 函数 将 被 调用 。 

。 每 当 类 型 X 的 一 个 对 象 被 销毁 时 , 类 型 X 的 析 构 函数 将 被 调用 。 

每 当 类 型 的 一 个 对 象 被 销毁 时 , 该 类 型 的 析 构 薄 数 将 被 调用 ; 这 种 情况 可 能 发 生 在 变量 的 作 
用 域 结束 时 、 程 序 结束 时 或 者 delete 作用 于 一 个 指向 对 象 的 指针 时 。 每 当 类 型 的 一 个 对 象 被 构建 
” 时 , 该 类 型 的 构造 函数 将 被 调用 ; 这 种 情况 可 能 发 生 在 变量 被 初始 化 时 、 通 过 new 构建 对 象 ( 除 了 
内 建 类 型 ) 时 以 及 拷贝 对 象 时 。 

为 了 对 这 个 问题 进行 体会 , 我 们 在 构造 函数 、 赋 值 函 数 以 及 析 构 函数 内 加 入 了 打印 语句 。 
例如 : 


struct X { // simple test class 
int val; 


void out(const string& s,int nv) 
{cerr<<this <<"—>" <<Ss<<T: "ceva << ("ccnve<<") Nn", } 


XO{ out("X0O", 0); val=0; } 
X(int v) { out( "XCGint)" ,v); val=v; } 
X(const X& x){ out("X(X&) ", x.val); val=x.val;} 
X& operator=(const X& a) 
{out("X::operator=()", a.val); val=a.val; return *this; } 
~X(O) { out("~XO", 0); } 


}; 有 
我 们 这 么 做 的 目的 在 于 使 类 型 X 能 够 在 程序 运行 中 留 下 一 些 信息 以 供 我 们 学 习 。 例 如 : 
X glob(2); //a global variable . 


X copy(X a) { return a; } 

x copy2(X a) { Xaa=a; return aa; } : 
X& ref to(X& a) { 全 a;} 

X* make(int i) { X a(j); return new X(a); } 


Struct XX { Xa; Xb;}; 


int main() 

{ 
X loc(4); ~ 1 local variable 
Xloc2 = loc; 
loc = X(5); 


loc2 = copy(loc); 
ioc2 = copy2(loc); 
X loc3(6); 
X&r=ref tolloc); 
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delete make(7); 

delete make(98); 

vector<X> v(4); 

XX loc4; 

X* p= new X(9); // an X on the free store 

delete p; | 

X* pp = new X[5]; //an array of Xs on the free store 

delete [] pp; 
} 


试 着 执行 这 一 程序 。 
试 一 试 ”运行 这 一 程序 示例 并 确保 你 能 够 弄 清 程序 结果 的 含义 。 如 果 你 这 么 做 了 ， 

你 就 能 够 明白 对 象 的 构造 与 析 构 的 大 臻 过程。 

根据 你 所 使 用 编译 器 的 质量 的 不 同 , 你 可 能 会 发 现 一 些 与 函数 copy( ) 和 copy2( ) 有 关 的 “ 丢 
失 拷 贝 ”。 我 们 可 以 看 出 这 两 个 函数 并 没有 做 任何 有 意义 的 事情 : 它们 仅仅 将 值 原封 不 动 地 从 函 
数 输入 拷贝 到 函数 输出 。 如 果 编 译 器 的 智能 足以 发 现 这 一 事实 , 那么 编译 器 将 会 消除 函数 copy( ) 
和 copy2( ) 对 拷贝 构造 函数 的 调用 。 一 些 较为 智能 的 编译 器 能 够 消除 不 必要 的 拷贝 。 

为 什么 要 如 此 麻烦 地 设计 这 样 一 个 类 型 X 呢 ? 这 有 点 像 音乐 家 们 所 必须 做 的 指法 练习 。 通 
过 做 这 些 简 单 的 事情 , 那些 真正 有 意义 的 事情 就 比较 容易 理解 了 。 并 且 , 如 果 你 对 构造 函数 和 析 
构 函 数 存 有 疑问 , 那么 你 也 可 以 在 自己 实际 的 类 型 的 构造 函数 中 加 入 打印 语句 以 了 解 这 些 函 数 的 
工作 过 程 。 对 于 大 一 些 的 程序 而 言 , 添加 打印 语句 显得 有 些 繁琐 , 但 技术 本 质 是 相似 的 。 例 如 ， 
你 可 以 通过 判断 构造 函数 的 调用 次 数 与 析 构 函数 的 调用 次 数 的 差 值 是 否 为 零 , 确定 程序 中 是 否 存 
在 内 存 泄漏 问题 。 忘 记 为 获取 了 资源 或 者 具有 指针 成 员 的 类 型 定义 构造 函数 与 析 构 函数 是 十 分 
常见 的 问题 一 一 避免 这 一 问题 是 容易 的 。 

如 果 你 的 程序 存在 很 大 的 问题 以 至 于 不 能 通过 这 些 简 单 的 方法 进行 处 理 , 那么 你 应 该 学 会 使 
用 一 些 专业 的 工具 来 处 理 这 些 问 题 ; 这 些 工具 通常 称 为 “内 存 泄漏 探测 器 ” 。 当 然 , 最 理想 的 情况 
是 通过 使 用 能 够 避免 内 存 泄漏 的 技术 使 得 内 存 泄漏 问题 不 会 产生 。 


18.4 访问 回 量 元 素 


到 目前 为 止 (参见 17.6 节 ) , 我 们 已 经 使 用 过 类 型 vector 的 成 员 函 数 set( ) 和 get( ) 访 问 vector 
对 象 包含 的 元 素 , 但 这 些 用 法 比较 繁琐 、 低 效 。 我 们 希望 能 够 通过 下 标 符 号 v[i] 对 vector 对 象 中 
的 元 素 进 行 访 问 。 为 了 实现 这 一 目标 ,我 们 需要 定义 一 个 称 为 operator[ ] 的 成 员 铺 数 。 下 面 是 我 


们 的 初次 符 试 : 
class vector { 
int Sz; jthe size 
double* elem;  //a pointer to the elements 
public: 


/... 
double operator[](int n) { return elemIn]l; } /return element 


}; 
上 面 的 代码 看 起 来 令 人 满意 且 实 现 简 单 , 但 不 幸 的 是 实现 过 于 简单 了 。 上 面 的 下 标 操作 (operator 
[]() ) 只 实现 了 对 元 素 的 读 操作 而 没有 实现 对 元 素 的 写 操 作 


Vector v(10); 
intx=v[2]; j fine 
VvI3] = x; // error: v{3] is not an lvalue 


这 里 v[ i 被 解释 为 函数 调用 v operator[ ] (i), 且 调 用 返回 对 象 v 的 编号 为 i 的 元 素 。 对 于 上 述 
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vector 类 型 而 言 , v[3] 是 一 个 浮 点 类 型 的 数值 ， 而 不 是 一 个 浮 点 类 型 的 变量 。 
试 一 试 ”编写 这 一 版 本 的 vector 类 型 的 完整 实现 , 并 观察 对 于 语句 v[3] =xji， 编 译 
器 将 会 报告 怎样 的 错误 消息 。 
我 们 进一步 进行 如 下 尝试 : 函数 operator[ ] 返回 指向 对 应 元 素 的 指针 : 


class vector { 


int sz; // the size 
double* elem; // a pointer to the elements 
Public: 


h... 
double* operator[](int n) { return &elem[n]l;} /return pointer 
}; 
根据 函数 定义 ,我们 可 以 编写 如 下 代码 : 
vector v(10); 
for (int i=0; ji<v.size(); ++i) { // works, but still too ugjy 
*v[i] = ji; 
cout << *v[i]; 


} | 
v[ij 在 这 里 被 解释 为 函数 调用 v. operator[ ] (i), 且 调 用 返回 指向 对 象 v 的 编号 为 i 的 元 素 的 指针 。 


但 这 种 实现 的 问题 是 , 在 我 们 对 元 素 进行 访问 时 , 我 们 不 得 不 首先 使 用 操作 符 “”” 对 指针 进行 解 
引用 。 这 样 的 实现 无 疑 会 使 得 元 素 的 访问 变 得 繁琐 。 我 们 可 以 通过 使 下 标 操作 符 返 回 元 素 的 引 
用 以 解决 这 一 问题 : 


class vector { 
Wn 
double& operator[ ](int n) { return elem[n]; } //return reference 


}»; 

现在 , 我 们 可 以 编写 如 下 代码 : 

vector v(10); 

for (int i=0; iji<v.size(); ++i) { HA works! 
vi = i; /f vli} returns a reference element i 
cout << v[il; 

} 


上 述 实 现 使 得 对 象 vector 的 下 标 操作 符 具 有 与 常规 下 标 操 作 符 相似 的 含义 : v[ i] 被 解释 为 函数 调 
用 v operator[ ] (i), 且 调 用 返回 对 象 v 的 编号 为 i 的 元 素 的 引用 。 
18. 4. 1 对 const 对 象 重 载 运算 符 

到 目前 为 止 ，operator[ ] ( ) 的 定义 存在 一 个 问题 : 它 不 能 用 于 const vector 类 型 的 对 象 。 例 如 : 


void f(const vector& cv) 


double d = cv[1]; //error, but should be fine 
cv[1] = 2.0; f/f error (as it should be) 
} 


其 原因 在 于 函数 vector :: operator[ ]( ) 可 能 会 潜在 地 改变 vector 对 象 的 元 素 成 员 。 即 使 该 函数 实际 
上 没 对 元 素 成 员 进行 修改 , 编译 器 仍 会 认为 这 是 一 个 错误 ,因为 我 们 没有 将 这 一 情况 告诉 它 。 解 
决 这 一 问题 的 方法 是 为 下 标 操作 再 定义 一 个 入 const 成 员 函 数 (参见 9.7.4 节 ): 

class vector { 


Ia 
double& operatorD(int n); / for non-const vectors 
double operator[](int n) const; /for const vectors 
}; > 
在 const 版 本 的 函数 中 , 函数 只 返回 double 类 型 的 值 , 而 不 是 返回 double& 类 型 的 引用 。 同 样 我 们 
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也 可 以 返回 const double& 类 型 , 但 由 于 一 个 double 类 型 的 变量 占用 的 内 存 空间 很 少 ,' 返 加 这样 的 
变量 的 引用 是 没有 必要 的 (参见 8. 5.6 节 ), 因此 这 里 函数 通过 传 值 的 方式 返回 数据 。 现在 . 我 们 


可 以 编写 如 下 代码 ; 
void ff(const vector& cv vector& v) 
{ 
double d= cv[1]; /fine (uses the const []) 
ov[1] = 2.0; I error (uses the const []) 
double d=v[1]; /fine (uses the non-const []) 
VvI1] = 2.0， fine (uses the non-const []) 


} 
由 于 我 们 常常 需要 通过 const 引用 的 方式 传递 vector 对 象 , 因此 为 函数 operator[ ] ( ) 实现 const 版 
本 是 十 分 必要 的 。 


18.5 数组 


我 们 已 经 通过 使 用 数组 来 引用 在 自由 存储 区 中 顺序 排列 的 对 象 。 与 命名 变量 一 样 , 我 们 也 可 
以 在 其 他 的 地 方 分 配 数组 。 实 际 上 , 数组 可 以 作为 

e 全 局 变量 (但 定义 全 局 变量 通常 是 一 个 粳 糕 的 主意 ) 

。 局 部 变量 (但 数组 作为 局 部 变量 时 会 受到 严格 的 限制 ) 

e 函数 成 员 ( 但 一 个 数组 不 知道 其 自身 大 小 ) 

。 类 的 成 员 ( 但 数组 成 员 难 于 初始 化 ) 

现在 , 你 可 能 会 发 觉 我 们 更 赞成 使 用 vector 类 型 而 不 是 数组 。 我 们 应 当 尽 可 能 地 用 vector 类 
型 取代 数组 。 尽 管 如 此 , 数组 在 vector 对 象 出 现 之 前 就 已 经 存在 了 很 长 的 时 间 , 并 且 它 与 其 他 编 
程 语言 中 (如 C 语言 ) 的 数组 提供 的 功能 大 致 相同 , 因此 我 们 必须 学 会 如 何 使 用 数组 ， 以 便 我 们 能 
够 处 理 那 些 很 久 以 前 编写 的 代码 , 或 者 那些 由 不 能 使 用 vector 类 型 的 人 编写 的 代码 。 

那么 , 什么 是 数组 呢 ? 我 们 该 如 何 定义 数组 ? 我 们 该 如 何 使 用 数组 ? 数组 是 在 内 存 空 间 中 顺 
序 排列 的 同类 型 对 象 的 集合 ; 也 就 是 说 , 数组 的 所 有 元 素 都 具有 相同 的 类 型 , 并 且 各 元 素 之 间 不 
存在 内 存 空 隙 。 数 组 中 的 元 素 从 0 开始 顺序 编号 的 。 数 组 可 以 用 “ 方 插 号 "表示 : 


const int max = 100; 


int gai[max]; // a global array (of 100 ints); “lives forever” 
void flint n) 
{ 
char lac[20]; /local array; “lives” until the end of scope 
int lai[60]; 


double lad[n]; // error: array size not a constant 
hi... 


} 
注意 , 数组 的 使 用 存在 一 个 限制 : 对 于 一 个 命名 数组 而 言 , 在 程序 编译 时 必须 知道 该 数组 包含 元 
素 的 数目 。 如 果 你 希望 元 素 的 数目 是 一 个 变量 , 那么 你 必须 在 自由 存储 区 中 分 配 数组 , 并 通过 指 
针对 数组 进行 访问 。vector 类 型 就 是 这 么 做 的 。 

像 在 自由 存储 区 存放 的 数组 一 样 , 我 们 通过 下 标 与 解 引用 操作 符 ([ ] 和 ”) 访 问 命名 数组 。 


例如 : 
void f2() 
{ 
char lac[20]; I local array; “lives” until the end of scope 


lac[l7] = 'a'; 
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*lac='b'; // equivalent to jacI0]='b' 


lact~2] = 'b'; /huh? 
lac[t200] = 'c'; /huh? 
} 


这 个 函数 能 够 通过 编译 , 但 我 们 知道 “通过 编译 ”并 不 意味 着 函数 能 够 “正确 工作 ”。 操 作 符 [ ] 的 
使 用 是 显而易见 的 , 但 函数 并 没有 进行 范围 检查 。 因 此 , 虽然 函数 全 ( ) 通 过 了 编译 , 但 对 lac 
[-2] 和 lac[ 200] 进 行 写 操作 的 后 果 是 灾难 性 的 , 我 们 应 避免 这 样 的 操作 。 | 

那么 编译 器 是 否 能 够 知道 lac 只 有 20 个 元 素 以 至 于 能 够 知道 lac[ 200 ] 是 错误 的 呢 ? 编译 器 能 
够 这 样 做 , 但 就 我 们 所 知 , 到 目前 为 止 没有 哪 一 个 编译 器 实现 了 这 样 的 功能 。 问 题 在 于 在 编译 期 
间 跟 踪 数 组 的 范围 通常 来 说 是 不 可 能 的 , 并 且 只 查找 那些 在 最 简单 情况 中 存在 的 错误 (如 上 面 的 
错误 ) 并 不 是 十 分 有 用 。 
18. 5.1 指向 数组 元 素 的 指针 


指针 可 以 指 问 数 组 的 元 素 。 例 如 : 
double ad[10]; 
double* p = &ad[5]; h point to ad[5] 


现在 , 指针 p 指向 double 型 元 素 ad[5], 如 下 图 所 示 : 


tt! 
Sti 
Pp: Bsn 





我 们 能 够 对 指针 使 用 下 标 与 解 引用 操作 符 ， 
*p =7; 
p[2] = 0; 
p[-3] = 9; 





也 就 是 说 , 我 们 可 以 使 用 正 数 或 负数 作为 指针 的 下 标 操作 数 。 只 要 元 素 位 于 数组 的 范围 之 内 ， 
那么 这 样 的 操作 就 是 正确 的 。 然 而 , 通过 指针 访问 位 于 数组 范围 之 外 的 数据 是 非法 的 (参见 
17.4.3 贡 )。 通 常 ， 编译 器 不 能 监测 对 数组 范围 之 外 数据 的 访问 , 并 且 这 样 的 访问 很 可 能 是 灾 
难 性 的 。 

当 指针 指 四 一 个 数组 时 ,， 加 操作 与 下 标 操 作 能 够 改变 指针 , 使 得 指针 指向 数组 中 的 其 他 元 
素 。 例 如 : 

p += 2; // move p 2 elements to the right 


我 们 可 以 得 到 下 图 : 
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并 且 


p-=5; // move p 5 elements to the left 


我 们 可 以 得 到 下 图 : 





通过 操作 符 + 、- 、+=、 -= 移动 指针 的 操作 称 为 指针 运算。 当 进 行 这 种 类 型 的 操作 时 , 我 
们 需要 保证 指针 指向 的 范围 ,指针 只 能 在 数组 的 范围 内 进行 移动 : 


Pp += 1000; /insahne: p points into an array with just 10 elements 
double d="*p; /illegal: probably a bad value 

// (definitely an unpredictable value) 
*p = 12.34; // illegal: probably scrambles some unknown data 


不 幸 的 是 , 由 指针 运算 所 造成 的 错误 有 时 很 难 被 发 现 。 通 常 最 好 的 策略 是 尽量 避免 使 用 指针 
运算 。 

指针 运算 最 常见 的 操作 是 对 指针 进行 自 增 操作 (使 用 ++ ) 以 使 指针 指向 下 一 个 元 素 , 以 及 对 
指针 进行 目 减 操作 (使 用 -- ) 以 使 指针 指 问 上 一 个 元 农 。 例 如, 我 们 可 Eb ad 
元 素 的 取 值 : 

for (double* p = &adi0]; p<&adi10]; ++p) cout << *p << \n'; 
或 者 反 向 打印 : 

for (double* p = &adi9]; p>=&ad[0]; ~—p) cout << *p << Nn'; 
通过 这 样 的 方式 进行 指针 运算 是 比较 常见 的 。 尽 管 如 此 , 我 们 发 现 岗 在 编写 上 面 一 个 例子 ( 反 向 ) 时 
很 容易 产生 错误 。 为 什么 是 &ad[9] 而 不 是 &ad[10]? 为 什么 是 >= 而 不 是 > ? 这 些 例 子 也 可 以 
通过 下 标 操作 很 好 地 实现 。 这 些 例子 也 可 以 通过 使 用 vector 类 型 实现 , 而 vector 类 型 更 容易 实现 
数组 范围 的 检查 。 

注意 , 指针 元 素 另 一 种 常用 的 方式 是 将 指针 作为 函数 的 参数 进行 传递 。 在 这 种 情况 下 ， 编 译 
器 并 不 知道 指针 指向 的 数组 包含 元 素 的 个 数 : 你 需要 主动 地 提供 这 些 信息 。 

为 什么 C++ 允许 进行 指针 运算 呢 ? 指针 运算 可 能 会 造成 错误 , 并 且 我 们 能 够 通过 下 标 操作 
实现 指针 运算 所 提供 的 任何 操作 。 例 如 : 

double* p1 = &adi0]; 

double* p2 = p1+7; 


double* p3 = &p1[7]; 
if (p2 != p3) cout << "impossiblei\n"; 


C++ 允许 指针 运算 主要 是 因为 历史 原因 。 指 针 运 算 在 很 久 以 前 就 在 C 语言 中 存在 , 将 它 噜 
除 会 造成 很 多 代码 不 能 够 运行 。 还 有 部 分 原因 在 于 , 在 一 些 低层 次 的 应 用 (例如 内 存 管理 器 ) 中， 
使 用 指针 运算 更 为 便利 。 
18. 5.2 指针 和 数组 


数组 的 名 字 代 表 了 数组 的 所 有 元 素 。 例 如 : 
char ch[100]; 


ch 的 大 小 sizeof(ch) 为 100。 然 而 , 数组 的 名 字 可 以 转化 (退化 ) 为 指针 。 例 如 : 
char* p=ch; 


p 被 初始 化 为 &ch[0], 并且 sizeof(p) 通 常 为 4( 而 非 100)。 
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这 一 实现 是 十 分 有 用 的 。 例 如 , 考虑 函数 strlen( ) , 它 能 够 统计 一 个 以 0 结尾 的 字符 数组 中 
包含 的 字符 总 数 : 


int strien(const char* p) /similar to the standard library strien() 
{ 

int count = 0; 

while (*p) { ++count; ++p; } 

return count; 


} 
我 们 可 以 通过 strlen( ch) 或 strlen(&ch[0] ) 对 函数 进行 调用 。 你 可 能 认为 这 不 过 是 一 个 非常 小 的 
书写 上 的 优势 , 我 们 赞同 这 一 看 法 。 

将 数组 名 转化 为 指针 的 一 个 原因 在 于 避免 将 大 量 数据 以 传 值 的 方式 进 1 J 参数 传递 。 例如 : 


int strlen(const char a[]))  // similar to the standard library strlen() 


{ 
int count = 0; 
while (afcoun{]) { ++count; } 
return count; 

} 

char lots [100000]; 

void f() 

{ 
int nchar = strlen(lots); 
li... 

} 


你 可 能 会 认为 strlen 函数 调用 时 会 将 函数 参数 所 指向 的 100000 个 字符 进行 拷贝 , 但 实现 上 这 一 操 


作 并 不 会 发 生 。 取 而 代 之 的 是 , 编译 器 会 认为 参数 char p[ ] 等 价 于 char* p, 并 且 函 数 调用 strlen 
(lots) 等 价 于 strlen( &lots[0] ) 。 这 一 实现 会 帮助 你 避免 拷贝 操作 的 庞大 开销 , 但 可 能 会 使 你 感到 
惊奇 。 为 什么 呢 ? 因为 在 其 他 的 所 有 情况 下 ， 当 你 向 函数 以 传 值 方式 传递 一 个 对 象 时 ,这 一 对 象 
总 会 被 拷贝 。 
注意 , 通过 数组 名 获得 的 指向 数组 第 一 个 元 素 的 指针 不 是 一 个 变量 , 我们 不 能 对 它 进 行 赋值 操作 : 
char ac[10]; 


ac= new char [20]; / error: no assignment to array name 
&ac[0] = new char [20]; // error: no assignment to pointer value 


最 终 ， 编 译 器 将 会 发 现 这 一 错误 ! 
作为 数组 名 向 指针 隐 式 转换 的 一 个 结果 , 我 们 不 能 通过 赋值 操作 拷贝 数组 : 
int x[100]; 
int y[100]; 
/ee 


x=y; .Herror 
int z[100] =y;  // error 


如 果 你 需要 拷贝 一 个 数组 ， 你 必须 编写 一 些 更 复杂 的 代码 来 实现 。 例 如 


for (int i=0; i<100; ++i) x[i]=y[i]; I copy 100 ints 
memcpy(xy100*sizeof(inft); l copy 100*sizeof(int) bytes 
copy(y,y+100, x) // copy 100 ints 


注意 , C 语言 不 支持 像 vector 之 类 的 类 型 , 因此 在 C 中 , 你 必 须 使 用 数组 类 型 。 这 意味 着 仍 有 很 多 的 

C++ 代码 使 用 数组 类 型 。 特 别 地 ，C 风格 的 字符 串 ( 以 0 结尾 的 字符 数组 , 参见 27.5 节 ) 是 十 分 常见 的 ， 

如 果 你 希望 使 用 赋值 操作 实现 数组 拷贝 ,那么 你 应 该 人 vector 之 类 的 类 型 。 等 价 于 上 述 
拷贝 代码 的 vector 实现 为 : 


筑 18 芭 向 时 和 数组 383 





vector<int> x(100); 
vector<int> y(100); 

Ler 

X=Yy; / copy 100 ints 


18. 5.3 ”数组 初始 化 

与 vector 以 及 用 户 定 义 的 其 他 容器 相 比 , 数组 具有 一 个 十 分 重要 的 优点 : C++ 提供 数组 初始 
化 的 文 持 。 例 如 

char ac[] = "Beorn"; /array of 6 chars 
数 一 数 上 面 的 字符 数 , 共有 5 个, 但 ac 是 一 个 具有 6 个 元 素 的 数组 : a I 
尾 添加 字符 0, 如 右 图 所 示 。 字 符 串 以 0 结尾 在 C 以 及 很 多 系统 中 都 作为 ”a 国葬 
字符 串 的 规范 。 我 们 称 以 0 结尾 的 字符 串 数组 为 C 风格 的 字符 串 。 所 有 的 
字符 串 常量 都 是 C 风格 的 字符 串 。 例 如 : 

char* pc = "Howdy"; /pcpoints to an array of 6 chars 
右 图 描绘 了 这 一 风格 。 注 意 , 以 0 为 取 值 的 字符 不 等 于 字符 "0 或 其 他 ”pc 国有 
的 字母 数字 。 以 0 结尾 的 目的 在 于 帮助 函数 定位 字符 的 结尾 。 应 记 住 
的 是 : 数组 并 不 知道 它 本 身 的 实际 大 小 。 根 据 以 0 结尾 这 一 规范 , 我 们 
可 以 编写 如 下 代码 . 


int strien(const char* p) /similarto the standard library strlen() 
{ 
.intn =0; 
while (pIn]) ++0; 
return n; 








} 

实际 上 , 我 们 不 需要 自己 实现 strlen( ) 这 一 函数 , 因为 该 泡 数 是 一 个 在 头 文 件 < string. h > 中 
定义 的 标准 库 函 数 (参见 27.5 节 和 附录 B10.3)。 注 意 , stlen( ) 只 统计 字符 数 , 并 不 统计 字符 串 
结尾 的 0 字符 ; 也 就 是 说 , 我 们 需要 n+1 个 字符 空间 以 存储 C 风格 字符 串 中 包含 的 n 个 字符 。 

只 有 字符 数组 能 够 通过 字符 串 进行 初始 化 , 但 所 有 的 数组 都 能 够 通过 与 其 类 型 相 匹 配 的 值 列 
表 进 行 初始 化 。 例 如 : 


int ai{] = {1, 2, 3, 4, 5, 6 ); /array of 6 ints 

int ai2[I100] = { 0,1,2,3,4,5,6,7,8,9 }; // the last 90 elements are initialized to 0 
double ad[100] = {); // all elements initialized to 0.0 

char chars[] = { 'a', 'b', 'c' }; /no terminating 0! 


注意 ，ai 的 元 素 个 数 为 6( 不 是 7) 且 chars 的 元 素 个 数 为 3( 而 非 4) 一 一 “在 末尾 加 0” 这 一 规则 只 
适用 于 字符 串 。 如 果 在 初始 化 数组 时 未 明确 指定 其 大 小 , 那么 编译 器 将 通过 初始 化 列表 中 包含 的 
元 素 个 数 确定 数组 的 大 小 。 这 是 相当 有 用 的 特性 。 如 果 初 始 化 的 元 素 个 数 小 于 数组 的 实际 大 小 
(如 ai2 和 ad), 数组 的 剩 下 元 素 将 被 设置 为 该 元 素 类 型 的 默认 值 。 
18. 5.4 指针 问题 

与 数组 类 似 , 指针 在 使 用 过 程 中 常会 出 现 问题 。 因 此 , 我 们 将 在 本 节 对 经 常 出 现 的 问题 进行 
结 。 特 别 地 , 由 指针 所 产生 的 严重 问题 通常 涉及 对 数据 的 意外 访问 , 并 且 很 多 这 一 类 型 的 问题 
都 涉及 对 数组 范围 之 外 的 数据 的 访问 。 在 本 节 中 , 我 们 主要 考虑 如 下 问题 : 

。 使 用 null( 空 ) 指针 进行 数据 访问 。 

。 使 用 非 初始 化 指针 进行 数据 访问 。 

。 对 数组 结尾 之 后 的 数据 进行 访问 。 
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。 对 未 分 配对 象 的 访问 。 
。 对 作用 域 之 外 的 对 象 进 行 访问 。 

在 所 有 的 情况 下 , 对 于 编程 者 而 言 , 一 个 实际 的 问题 是 所 有 实际 的 访问 看 起 来 都 没有 问题 ; 
指针 仅仅 是 没有 被 赋予 合适 的 值 。 更 糟糕 的 是 ,这些 问 题 可 能 会 在 某 些 表面 上 不 相关 的 对 象 出 现 
错误 之 后 才 会 显现 。 例如 : 

不 要 使 用 null 指针 进行 数据 访问 : 

int* p=0; 

*p=7; /ouch! 


在 实际 的 程序 中 ， 当 问 题 发 生 时 ， 在 指针 的 初始 化 与 使 用 之 间 通 常 还 存在 一 些 其 他 的 代码 。 特 别 
地 ,， 回 盟 数 传递 p 或 者 使 用 函数 的 返回 值 作为 p 的 取 值 是 十 分 常见 的 例子 。 我 们 通常 不 应 该 向 函 
数 传 递 null 指针 , 但 如 果 我 们 不 得 不 这 么 做 时 , 我 们 应 在 使 用 指针 前 测试 指针 是 否 为 null: 


int* p = fct_that_can_return_a_0(0); 
if (p == 0) { 
/do something 


else { 
/usep 
*p=7; 
} 


并 且 
void fct_that_can_receive_a_0(int* p) 
{ 
if (p == 0) { 
/ do something 


else{ 
/usep 
*p = 7; 
} 
} 


使 用 引用 (参见 17. 9. 1 节 ) 和 使 用 异常 以 捕获 错误 (参见 5.6 节 和 19.5 ee 
对 指针 进行 初始 化 : 


int* p; 

*p a AH ouch! 
特别 地 , 不 要 忘 了 对 作为 类 成 员 的 指针 进行 初始 化 。 

不 要 访问 不 存在 的 数组 元 素 : 

int a[10]; 

int* p = &a[10]; 

ee Wouchli 

af[10] = A ouch! 
SS 元素 以 及 最 后 一 个 元 素 时 应 应 特别 小 心 。 取而代之 的 是 ， 我 们 可 以 使 用 
Vector 类 型 。 如 采 我 们 确实 需要 在 多 于 一 个 的 函数 中 使 用 数组 (将 它 作为 函数 的 参数 ) , 那么 我 们 
就 应 极其 小 心 并 且 应 将 数组 的 大 小 也 作为 函数 的 参数 进行 传递 。 

不 要 通过 一 个 已 经 进行 delete 操作 的 指针 访问 数据 ， 

int* p = new int(7); 

1... 

delete p; 


Ws 
*p=13; /ouch! 
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代码 delete p 以 及 此 后 的 代码 会 改写 p 指向 的 内 存 区 域 中 包含 的 数据 。 在 所 有 问题 中 我 们 议 田 
这 一 问题 是 最 难 发 现 和 避免 的 。 防 止 这 一 问题 的 最 有 效 方 法 是 避免 出 现 “ 暴 露 的 ”new 操作 以 及 
delete 操作 : 只 在 构造 函数 与 析 构 函数 中 使 用 new 与 delete, 或 者 使 用 容器 (如 Vector ref( 大 见 附 
录 E. 4) ) 来 处 理 delete。 


不 要 返回 指向 局 部 变量 的 指针 : 
int* f() 


int* p = f(); 
Wa 
“p= = 15; /ouch! 


函数 f( ) 的 返回 值 以 及 此 后 的 代码 会 造成 对 p 指向 内 存 区 域 中 数据 的 改写 。 造 成 这 一 问题 的 原因 

在 于 , 函数 中 的 局 部 变量 在 进入 函数 时 被 分 配 内 存 空 间 ( 在 栈 中 ), 而 局 部 变量 所 占用 的 内 存 空间 

将 在 函数 退出 时 被 释放 。 特 别 地 , 在 类 对 象 中 的 局 部 变量 所 占 内 存 空 间 将 在 类 的 析 构 函数 调用 时 

被 释放 (参见 17. 5. 1 节 ) 。 编 译 器 不 能 够 监测 与 返回 指向 局 部 变量 指针 相关 的 大 部 分 问题 。 
例如 下 面 的 一 个 在 逻辑 上 等 价 的 例子 : 


Vector& ff() 


{ 
Vector x(7); 


hl..; 
return x; 
} /the vector x is destroyed here 


MSss 


vector& Pe ff(); 
1.. 
p[4] = 15; /ouch! 


很 少 的 编译 器 能 够 监测 这 一 变量 的 返回 问题 。 

程序 员 们 很 可 能 会 低估 这 些 问题 。 然 而 , 很 多 有 经 验 的 程序 员 都 曾 被 这 些 问题 打败 。 解 决 的 
方法 是 不 要 在 代码 中 随意 使 用 指针 、 数 组 、new 和 delete。 如 果 你 这 人 么 做 了 , 那么 在 实际 的 程序 
中 , 光 靠 小 心 谨慎 是 不 够 的 。 取 而 代 之 的 是 ,我 们 应 使 用 vector、RAI( Resource Acquisition Is Ini- 
tialization; 参见 19.5 节 ) , 以 及 其 他 的 系统 途径 管理 内 存 和 其 他 资源 。 


18.6 实例 : 回 文 


我 们 已 经 展示 了 足够 多 的 技术 上 的 例子 ! 让 我 们 尝试 一 个 难题 。 回 文 是 一 种 单词 , 它 按照 顺 
序 以 及 道 序 的 方式 拼写 所 得 的 结果 是 一 致 的 。 例 如 ，anna、petep 以 及 malayalam 都 是 回 文 , 而 ida 
和 homesick 不 是 回 文 。 有 两 种 方法 判断 一 个 单词 是 否 是 回 文 : 
e 获得 单词 按 逆序 拼写 所 得 的 单词 副本 , 并 将 其 与 原 有 单词 进行 比较 。 
e 判断 单词 的 首 字符 与 尾 字 符 是 否 相 同 , 然后 判断 第 二 个 字符 与 倒数 第 二 个 字符 是 否 相 同 ， 
持续 进行 这 一 操作 直到 到 达 单 词 的 中 央 。 
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这 里 我 们 将 采取 第 二 种 方法 。 根 据 单词 的 表示 方式 以 及 跟踪 字符 比较 进度 的 方式 的 不 同 , 我 们 可 
以 通过 多 种 方式 实现 第 二 种 方法 。 我 们 将 采用 不 同 的 方法 实现 回 文 的 判断 ， 以 观察 不 同 的 语言 特 
征 是 如 何 影 响 代 码 的 形式 和 工作 方式 的 。 
18. 6.1 使 用 string 实现 回 文 

首先 , 我 们 使 用 标准 库 的 string 类 型 以 及 int 类 型 的 索引 跟踪 字符 比较 的 进度 : 


bool is_palindrome(const string& s) 


{ 


int first = 0; // index of first letter 

int last = s.lengthO—1; // index of last letter 

while (first < last) { // we haven't reached the middle 
if (s[firstl!=s[lastl) return false; 
++first; ~ // move forward 
—-last; /move backward 

} 

return true; 

} 


当 比 较 到 达 单 词 的 中 央 且 未 发 现 不 同 的 字符 时 ,函数 返回 .true。 我 们 建议 , 在 你 编写 这 段 代码 时 ， 
应 保证 代码 在 下 列 情况 下 都 是 正确 的 ; 当 字符 串 不 包含 字符 时 ; 当 字 符 串 只 包含 一 个 字符 时 ; 当 
子 符 串 包含 奇数 或 偶数 个 字符 时 。 当 然 , 我 们 可 以 不 只 是 依靠 逻辑 来 判断 代码 是 否 正确 。 我 们 可 
以 按照 下 面 的 方式 测试 : 
int main() 
{ 
string s; 
while (cin>>s) { 
cout << Ss << "is"; 
if (tis_palindrome(s)) cout << " not"; 
cout << " a palindrome\n"; 
} 
} 


我 们 使 用 string 类 型 的 原因 在 于 “string 类 型 更 便于 处 理 单词 "。 通 过 string 类 型 能 够 很 容易 地 将 以 
空白 字符 分 隔 的 单词 读 人 字符 串 ， 并 且 一 个 string 对 象 清楚 它 的 实际 大 小 。 如 果 我 们 希望 通过 is_ 
palindrome( ) 判断 包含 空白 字符 的 字符 串 是 否 为 回 文 , 那么 我 们 可 以 使 用 函数 getline( ) ( 见 11.5 
六 )。 这 时 ， 函数 结果 会 认为 ahha 和 as df fd sa 为 回 文 。 
18. 6.2 ”使 用 数组 实现 回 文 

如 果 不 能 使 用 string 类 型 (或 vector 类 型 ) 时 , 那么 我 们 只 好 使 用 数组 存储 字符 。 例 如 : 


bool is_palindrome(const char s[], int n) 
/ s points to the first character of an array of n characters 


{ 
int first = 0; / index of first letter 
int last = n—1; // index of last jetter 
while (first < last) { / we haven't reached the middle 
if (s[first]!=s[last]) return false; 
十 +first;  // move forward 
~~last; //move backward 
} 
return true; 
} 


为 了 测试 is_palindrome( ) , 我 们 首先 需要 将 字符 读 入 数组 。 为 了 实现 这 一 操作 , 一 种 安全 的 方法 
如 下 : 


务 18 章 向 时 和 发 绍 387 


istream& read_word(istream& is, char* buffer int max) 
// read at most max—1 characters from is into buffer 


{ 
is.width(max); // read at most max—1 characters in the next >> 
is >> buffer; // read whitespace-terminated word, 
// add zero after the last character read into buffer 
return is; 
} 


合理 地 设置 对 象 istream 的 宽度 能 够 避免 >> 操作 导致 缓冲 区 溢出 。 不 幸 的 是 , 这 意味 着 我 们 不 
道 读 操作 是 以 空白 符 为 结束 , 还 是 以 缓冲 区 满 为 结束 ( 因此 我 们 还 需要 继续 读 和 人 更 多 的 字符 )。 
一 方面 , 谁 还 记得 width( ) 函数 在 作为 输入 时 表现 出 的 具体 行为 信息 ?标准 库 中 的 string 与 vector 
类 型 更 适合 于 作为 输入 的 缓冲 区 ,因为 它们 能 够 根据 输入 数据 的 规模 动态 调整 它们 的 大 小 。 结 束 
字符 0 是 必需 的 ， 因为 对 字符 数组 (C 风格 字符 串 ) 的 大 多 数 操 作 总 是 假设 字符 串 以 0 结束 。 通 过 
星 数 read_word( ) , 我 们 可 以 编写 如 下 代码 : 
int main() 
{ 
const int max = 128; 
char s[max]; 
while (read._ word(cin,s,max)) { 
cout << ss << " is"; 
if (tlis_palindrome!(s,strlen(s))) cout << " not"; 
cout << "a palindrome\n"; 


} 
} 


函数 strlen(s) 返 回 当 函数 调用 read_word( ) 结束 之 后 , 数组 s 中 包含 的 字符 总 数 。 并 且 cout <<s 将 
输出 数组 中 的 元 素 , 直至 遇见 字符 0 为 止 。 

使 用 数组 的 代码 实现 要 远 比 使 用 string 类 型 的 代码 实现 复杂 , 并 且 当 我 们 试图 处 理 长 字符 串 
时 , 这 种 情况 会 变 得 更 糟 。 人 参见 习题 10。 
18. 6.3 ”使 用 指针 实现 回 文 

除了 使 用 索引 , 我 们 还 可 以 通过 指针 识别 字符 : 


bool is_palindrome(const char* first, const char* last) 
// first points to the first letter, last to the last letter 


{ 
while (first < last) { // we haven't reached the middle 
if (*firsti=*last) return false; 
++first;  // move forward 
—-—ilast; 1/ move backward 
} 
return true; 
} 


注意 , 实际 上 我 们 可 以 对 指针 进行 自 增 操作 或 自 减 操 作 。 自 增 操作 使 指针 指向 数组 中 的 下 一 
个 元 素 , 而 自 减 操作 使 指针 指向 上 一 个 元 素 。 如 果 指 针 指 向 的 区 域 超 出 了 数组 的 实际 范围 ,那么 
将 会 产生 严重 的 越界 错误 。 这 是 使 用 指针 可 能 会 产生 的 问题 。 

我 们 通过 如 下 方式 调用 is_palindrome( ) : 


int main() 
{ 
const int max = 128; 
char s[max]; 
while (read_word(cin,s,max)) { 
cout << Ss << "is'; 
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if (!is_palindrome(&s[0],&s[strlen(s)-1])) cout<< not ; 
cout <<"a palindromen ; 
} 
} 


我 们 还 可 以 按 如 下 方式 重 写 is_palindrome( ) : 


bool is_palindrome(const char* first, const char last) 
// first points to the first letter, last to the last letter 
{ 
if (first<last) { 
if (*first!=*1ast) return false; 
return is_palindrome(++first,~—last); 
} 
return true; 


} 


当 我 们 重新 描述 回 文 的 定义 时 ,， 上述 代码 的 意义 就 显而易见 了 : 一 个 单词 是 回 文 ， 当 它 的 首 字 符 
与 尾 子 符 相同 , 并 且 删 除 首 字符 与 尾 字 符 所 形成 的 单词 子 串 仍然 是 回 文 。 


人 ) 简单 练习 


本 章 有 两 个 练习 : 一 个 涉及 数组 , 男 一 个 涉及 vector 类 型 , 且 两 个 练习 的 内 容 大 致 相同 。 读 者 可 以 分 别 


完成 这 两 个 练习 ,并 对 练习 进行 比较 。 


数组 练习 : 


1. 定义 大 小 为 10 的 int 类 型 的 全 局 数组 ga, 并 将 数组 元 素 初始 化 为 1, 2, 4, 8, 16 等 。 


2. 定义 具有 两 个 参数 的 函数 f ) , 其 中 一 个 参数 为 int 类 型 数组 , 男 一 个 参数 指出 该 数组 包含 的 元 素数 量 。 
3. 在 畏 数 f( ) 中 : 
a) 定义 大 小 为 10 的 int 类 型 的 局 部 数组 。 
b) 将 ga 的 值 拷贝 至 la。 
c) 打印 la 的 所 有 元 素 。 
d) 定义 整 型 指针 p, 并 将 其 初始 化 指向 一 个 在 自由 存储 区 中 分 配 存储 空间 的 数组 , 该 数组 与 参数 数组 大 
小 相同 。 
e) 将 参数 数组 包含 的 值 拷贝 至 在 自由 存储 区 中 分 配 的 数组 。 
f) 打印 在 自由 存储 区 中 分 配 的 数组 的 所 有 元 素 。 
g) 释放 在 自由 存储 区 中 分 配 的 数组 所 占 的 空间 。 
4. 在 函数 main( ) 中 ， 
a) 调用 f( ) 并 以 ga 为 其 参数 。 
b) 定义 大 小 为 10 的 数组 aa, 并 将 其 元 素 初 始 化 为 前 10 个 阶乘 数 (1, 2*1, 3*2#1,4*3*2x*1 等 )。 
c) 调用 f 代 ) 并 以 aa 为 其 参数 。 
标准 库 vector 练习 : 
1. 定义 全 局 变量 vector < int > gv, 并 将 其 元 素 初 始 化 为 1, 2, 4, 8, 16 等 。 
2. 定义 函数 f(),， 且 函数 参数 为 vector < int > 类 型 的 向 量 。 
3. 在 函数 人 ( ) 中: 
a) 定义 局 部 变量 vector <int > lv, 且 1y 的 大 小 与 参数 向 量 相 同 。 
b) 将 gv 的 值 拷贝 至 ly。 
c) 打印 ly 的 所 有 元 素 。 
d) 定义 局 部 变量 vector <int > 1v2, 并 以 参数 向 量 初始 化 1v2。 
e) 打印 lv2 的 所 有 元 素 。 
4. 在 函数 main( ) 中: 


a) 调用 f() 并 以 gv 为 其 参数 。 
b) 定义 向 量 vector <int > vv, 并 将 其 元 素 初 始 化 为 前 10 个 阶乘 数 (1, 2x*1,3*2*1,4x*3#*2*1 等 )。 
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c) 调用 f() 并 以 vy 为 其 参数 。 


他 思考 


“ 买 者 自 慎 ! 的 含义 是 什么 ? 


. 对 于 类 对 象 而 言 , 拷贝 的 默认 含义 是 什么 ? 

.类 对 象 拷贝 的 软 认 含义 在 什么 情况 下 是 合适 的 ? 什么 情况 下 是 不 合适 的 ? 
. 什么 是 拷贝 构造 函数 ? 

. 什么 是 拷贝 赋值 ? 

. 拨 贝 赋值 与 拷贝 初始 化 之 间 有 什么 区 别 ? 

. 什么 是 浅 找 贝 ? 什么 是 深 找 贝 ? 

.vector 对 象 的 副本 与 该 vector 对 象 之 间 的 比较 如 何 ? 

. 类 的 5 种 必要 操作 有 哪些 ? 

. 什么 是 显 式 构造 函数 ? 在 什么 情况 下 应 该 使 用 显 式 构造 郑 数 ? 
.对 于 一 个 类 对 和 象 而 言 ， 哪些 操作 是 被 隐 式 调用 的 ? 

. 什么 是 数组 ? 

. 如何 找 贝 一 个 数组 ? 

.如 何 对 数组 初始 化 ? 

. 什么 时 候 应 该 使 用 指针 参数 而 不 是 引用 参数 ? 为 什么 ? 
ee 


7， 什么 是 回 文 ? 


ee 


数组 深 拷贝 显 式 构造 孙 数 数组 初始 化 默认 构造 函数 回 文 
拷贝 赋值 必要 操作 浅 拷贝 拷贝 构造 函数 


中 习题 


1， 编 写 函 数 char”strdup( const char* ) ,该 函数 能 够 将 C 风格 的 字符 串 复制 至 其 在 自由 存储 区 中 分 配 的 内 存 


当中 。 要 求 : 不 使 用 任何 标准 库 函 数 。 使 用 解 引用 操作 符 ″ “代替 下 标 操作 。 


.编写 函数 char”findx( const char”s，const char x), 该 函数 能 够 在 C 风格 字符 串 s 中 定位 字符 串 x 首次 出 


现 的 位 置 。 要 求 : 不 使 用 任何 标准 库 函 数 。 使 用 解 引用 操作 符 ” “代替 下 标 操作 。 


， 编 写 函 数 int stremp( const char” sl ，const char”s2 ) , 该 函数 能 够 比较 C 风格 的 字符 串 。 如 果 sl 按照 字典 


顺序 排 在 s2 之 前 ,函数 返回 负 整 数 ; 如 果 sl 与 s2 相同 , 函数 返回 0; 如 果 sl 按照 字典 顺序 排 在 s2 之 后 ， 
函数 返回 正 整数 。 要 求 : 不 使 用 任何 标准 库 函 数 。 使 用 解 引用 操作 符 ” “代替 下 标 操 作 。 


. 考虑 如 下 问题 : 如 果 向 函数 strdup( ) 、findx( ) 与 stremp( ) 传递 非 C 风格 字符 串 的 参数 , 会 出 现 什么 结果 ? 


试 一 试 。 首 先 , 尝试 向 函数 传递 不 以 0 为 结尾 的 字符 数组 (不 要 在 实际 ( 非 实验 性 ) 代码 中 编写 这 样 的 代 
码 ; 否则 可 能 会 造成 严重 的 破坏 ) 。 尝 试 一 下 传递 在 自由 存储 区 中 以 及 栈 中 分 配 的 “虚假 C 风格 字符 串 ”。 
如 果 程 序 结果 看 上 去 仍然 是 合理 的 , 那么 请 关闭 debug 模式 。 重 新 设计 并 实现 这 三 个 阔 数 , 使 得 这 些 函 
数 具 有 另 一 个 参数 ,该 参数 指定 了 字符 串 参数 中 包含 的 最 大 元 素 个 数 。 然 后 , 通过 正确 的 C 风格 字符 串 
以 及 “ 坏 " 字 符 串 测试 这 些 函 数 。 


， 编写 函数 string cat_dot( const string& sl ，const string& s2 ) ,该 函数 将 参数 字符 串 以 圆 点 相连 接 。 例 如 ，cat_ 


dot(“Niels”,“Bohr”) 返回 结果 Niels. Bohr。 


. 改写 习题 $ 的 函数 cat_dot( ) , 使 函数 具有 第 三 个 字符 串 参 数 , 且 该 参数 指定 分 隅 字符 串 ( 而 非 圆 点 )。 
. 改写 习题 6 的 函数 cat_dot( ) , 使 函数 以 C 风格 字符 串 为 参数 , 并 以 在 自由 存储 空间 中 分 配 的 字符 串 作为 


返回 结果 。 要 求 : 不 使 用 任何 标准 库 函 数 或 类 型 。 保 证 所 有 在 自由 存储 空间 中 分 配 ( 通 过 new) 的 内 存 空 
间 都 被 正确 地 释放 (通过 delete) 。 
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8. 改写 18.6 节 中 的 所 有 函数 。 也 数 通 过 构造 单词 的 逆向 副本 并 将 副本 与 原 有 单词 相 比 较 的 方式 确定 单词 
是 否 为 回 文 。 例 如 ， 由 “home” 产 生 “emoh”, 然后 比较 两 个 单词 是 否 相 同 。 因 此 ,home 不 是 一 个 回 文 。 

9. 考虑 17. 3 节 中 的 内 存 布局 。 编 写 一 个 程序 , 该 程序 能 够 指出 : 静态 存储 区 、 栈 区 、 自 由 存储 区 在 内 存 中 
的 布局 顺序 ; 栈 扩展 的 方向 : 是 向 高 地 址 空间 扩展 还 是 向 低地 址 空间 扩展 ? 在 自由 存储 区 中 分 配 的 数组 
中 , 具有 较 高 下 标的 元 素 是 在 高 地 址 空间 存储 中 还 是 低地 址 空间 中 存储 ? 

10. 回顾 18. 6. 2 节 中 关于 回 文 问题 的 数组 解决 方案 。 修 改 该 方案 使 之 能 够 对 长 字符 串 进 行 处 理 : 当 输 入 字 
符 串 过 长 时 , 会 提示 出 错 报告 ; 能 够 处 理 任 意 长 度 的 字符 串 。 评 价 这 两 种 实现 版 本 的 复杂 度 。 

11. 查找 (例如 , 通过 网 页 )skip list 的 概念 并 实现 这 种 类 型 的 列表 。 

12. 编程 实现 游戏 “ 猎 杀 怪兽 ”。“ 猎 杀 怪 兽 ” 是 一 种 由 Gregory Yob 发 明 的 简单 电脑 游戏 。 它 的 基本 前 提 是 一 
个 满 身 臭 味 的 怪物 居住 在 一 个 由 多 间 相 连 房间 构成 的 黑暗 的 山洞 里 。 你 的 任务 是 通过 弓箭 杀 死 怪兽 。 
除了 怪兽 之 外 , 山洞 中 还 存在 两 种 危险 : 无 底 陷 阱 和 巨型 蝙蝠 。 如 果 你 进入 的 房间 有 无 底 陷 阱 , 那么 游 
戏 将 结束 。 如 果 房 间 中 有 蝙蝠 , 那么 蝙蝠 将 把 你 抓 人 另 一 房间 之 中 。 如 果 房 间 中 有 怪兽 或 者 怪兽 进入 
了 你 所 在 的 房间 , 它 会 吃 掉 你 。 当 你 进入 一 个 房间 时 , 你 将 会 得 到 一 个 关于 附近 是 否 存在 危险 的 提示 : 
“我 团 到 了 怪兽 的 味道 ”; 是 指 怪 兽 在 相 邻 的 房间 中 。 

“我 感到 一 阵 微风 吹 来 ”: 是 指 相 邻 的 一 间 房 间 中 有 陷阱 。 

“我 听 到 蝙 晤 的 声音 ”; 是 指 相 邻 的 房间 中 有 蝙蝠 。 

山洞 中 的 每 一 个 房间 都 编 了 号 。 每 一 个 房间 通过 地 道 均 与 其 他 三 个 房间 相连 。 当 进入 一 个 房间 时 , 你 
将 会 得 到 诸如 “你 在 房间 12 中 ; 房间 12 通过 地 道 与 房间 1、13、4 相连 ; 移动 还 是 射击 ?一 种 可 能 的 答 
案 是 m13( 代表 移动 到 房间 13) 以 及 s134-3( 向 房间 13、4、3 射箭 ) 。 一 支 箭 的 覆盖 范围 为 三 个 房间 。 在 
游戏 开始 时 , 你 有 5 支 箭 。 射 击 的 后 果 是 它 会 惊醒 怪兽 并 且 怪 兽 将 向 与 它 当 前 所 在 房间 相 邻 的 房间 光 
跑 一 一 可 能 是 你 所 在 的 房间 。 

这 一 练习 的 难点 可 能 在 于 决定 房间 的 相连 关系 。 你 可 能 需要 使 用 随机 数 生成 器 (例如 std_lib_facilities. h 
中 声明 的 randint( ) 函数 ) 产 生 不 同 的 山洞 。 提 示 : 在 调试 中 , 应 使 程序 能 够 产生 关于 山洞 状态 的 输出 。 


人 附 言 
标准 库 vector 类 型 建立 在 低层 次 的 内 存 管理 工具 基础 之 上 , 例如 指针 与 数组 , 而 它 的 主要 功能 是 帮助 我 
们 避免 使 用 这 些 工具 所 带 来 的 复杂 性 。 当 我 们 设计 一 个 类 时 ,我们 必须 考虑 类 的 初始 化 、 拷 贝 与 析 构 。 





第 19 章 问 量 、 模 板 和 异 弟 


“成 功 不 是 终点 ” 





Winston Churchill 


本 章 将 讨论 最 常见 、 最 有 用 的 STL 容器 的 设计 与 实现 : vector。 在 本 章 中 , 我 们 将 展示 如 何 实现 
元 素数 量 可 变 的 容器 , 如 何以 参数 形式 指定 容器 中 元 素 的 类 型 ,如 何 处 理 越界 错误 。 与 前 面 类 似 ， 
本 章 中 介绍 的 技术 是 通用 的 , 而 不 仅仅 局 限于 vector 类 型 的 实现 , 甚至 不 仅仅 局 限于 容器 的 实现 。 
对 于 各 种 不 同 的 数据 类 型 , 我 们 将 展示 如 何 安 全 地 处 理 数 量 可 变 的 不 同类 型 的 数据 。 此 外 ,我 们 还 会 
介绍 一 些 实 际 问题 ,作为 设计 上 的 经 验 教训 。 本 章 中 所 用 技术 依赖 于 模板 与 异常 , 所 以 我 们 将 阐述 如 
何 定 义 模板 , 另外 , 针对 如 何 使 用 好 异常 这 一 问题 , 我 们 将 介绍 一 些 用 于 资源 管理 的 基本 技术 。 


19. 1 问题 


在 第 18 章 结束 时 , 我 们 设计 的 veetor 类 型 已 经 可 以 实现 如 下 功能 : 

e 创建 vector 类 型 对 象 , 其 元 素 类 型 为 双 精 度 浮 点 类 型 且 元 素数 量 可 以 任意 设置 。 

s 通过 赋值 与 初始 化 拷贝 vector 对 象 。 

e。 通过 vector 本 身 ,在 它们 离 作 用 域 时 ,正确 地 释放 所 占用 的 内 存 空间 。 

e 通过 传统 的 下 标 操作 访问 vector 对 象 中 的 元 素 ( 可 以 在 赋值 操作 符 = 的 左边 和 右边 ) 。 
掌握 这 些 知识 是 有 用 的 , 但 为 了 进一步 加 深 对 vector 的 了 解 ( 根 据 我 们 使 用 标准 库 中 vector 类 型 的 
经 验 ), 我 们 需要 解决 下 面 三 个 问题 : 

e 如 何 改 变 vector 对 象 的 大 小 (改变 其 包含 元 素 的 个 数 )? 

e。 如 何 捕获 和 报告 对 veetor 元 素 的 访问 越界 ? 

e。 如 何以 参数 的 方式 指定 vector 元 素 的 类 型 ? 
例如 , 如何 定义 vector 使 得 下 面 的 操作 是 合法 的 : 


vector<double> vd; // elements of type double 
double d; 

while(cin>>d) vd.push_back(d); // grow vd to hold all the elements 
vector<char> vc(100); J/ elements of type char 

int n; 

cin>>n; 

Vc.resize(n); /make vc have n elements 


显然 , 使 vector 类 型 能 够 完成 上 述 操 作 是 十 分 有 用 的 ， 但 从 编程 的 角度 看 ， 为 什么 这 些 操 作 
是 重要 的 呢 ? 对 于 一 个 单一 实体 vector, 我 们 可 以 改变 vector 的 两 种 属性 : 

e 元素 的 数量 

e 元 素 的 类 型 

可 变性 是 十 分 有 用 的 。 在 日 常生 活 中 , 我 们 总 是 要 收集 数据 。 看 看 我 的 桌子 , 我 看 见 了 一 堆 
银行 声明 、 信 用 卡 账单 、 电 话 话 费 单 。 而 这 些 东 西 本 质 上 是 一 系列 的 各 种 类 型 的 数据 信息 的 集 
合 : 字符 串 以 及 数值 。 在 我 的 面前 是 一 部 电话 ; 它 记 录 了 联系 人 的 姓名 与 电话 号 码 。 在 房间 的 书 
架 上 , 满 是 书籍 。 我 们 的 程序 也 是 相似 的 : 程序 中 包含 具有 各 种 不 同 元 素 类 型 的 容器 。 程 序 中 我 
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们 需要 使 用 不 同类 型 的 容器 ( vector 仅仅 是 最 常用 的 一 种 ) , 且 它 们 包含 诸如 电话 号 码 、 姓 名 、 交 
易 总 额 等 信息 。 本 质 上 来 说 , 关于 我 的 桌子 和 房间 的 例子 都 源 于 某 些 计算 机 程序 。 唯 一 的 例外 是 
电话 : 电话 可 以 类 比 为 一 台 计 算 机 ， 当 我 们 查找 联系 人 电话 号 码 时 , 我 们 实际 上 看 到 的 是 一 个 程 
序 的 输出 一 一 该 程序 与 我 们 现在 编写 的 程序 类 似 。 实 际 上 , 这 些 号 码 都 钙 人 存放 在 一 个 vector 
<Number > 类 型 的 对 象 之 中 。 

显然 , 并 不 是 所 有 的 容器 都 具有 相同 的 元 素数 量 。 那 么 我 们 是 否 可 以 只 使 用 元 素数 量 固定 的 
容器 呢 ? 也 就 是 说 , 在 编写 代码 时 是 否 不 使 用 诸如 push_back( ) 、resize( ) 之 类 的 操作 ? 答案 是 肯 
定 的 。 但 是 这 将 会 给 我 们 带 来 不 必要 的 负担 : 在 程序 中 只 使 用 固定 大 小 的 容器 的 基本 技巧 是 ， 当 
我 们 需要 增加 容器 包含 的 元 素数 量 时 ,我 们 需要 首先 将 原 有 容器 包含 的 元 素 移 至 一 个 更 大 的 容器 
之 中 。 例 如 : 


/ read elements into a vector without using push_back: 
vector<double>* p = new vector<double>(10); 
intn = 0; // number of elements 
double d; 
while(cin >> d) { 
if (n==p—>size()) { 
vector<double>* q = new vector<double>(p—>size()*2); 
copy(p->begin0, p-~>end(0, q->begin()); 
delete p; 
p=9; 
} 
(*p)in] = d; 
十 二 ny 


} 
这 并 不 完美 。 你 能 说 服 我 们 这 些 代码 是 正确 的 吗 ? 你 确认 吗 ? 注意 , 在 上 述 代码 中 , 我 们 是 如 何 
突然 开始 使 用 指针 并 显 式 地 进行 内 存 管理 的 ? 我 们 在 上 述 代码 中 所 使 用 的 内 存 管理 技术 是 针对 
大 小 固定 的 对 象 (数组 ; 参见 18.5 节 ) 的 。 然 而 , 使 用 容器 (如 vector) 的 一 个 重要 的 原因 是 , 它 能 
够 处 理 元 素数 量 的 动态 变化 , 从 而 帮助 我 们 避免 麻烦 并 减少 出 错 的 机 会 。 换 句 话说 , 容器 能 够 根 
据 用 户 的 实际 需要 动态 调整 其 大 小 。 例 如 : 


vector<double>vd; 
double d; 
while(cin>>d) vd.push_back(d); 


在 编程 中 ,容器 大 小 的 变化 是 否 是 常见 操作 呢 ? 如 果 不 是 , 那么 容器 大 小 的 动态 改变 并 不 会 
带 来 多 少 便利 。 然 而 , 在 实际 中 , 容器 大 小 变化 是 十 分 常见 的 操作 。 最 明显 的 例子 是 通过 容器 从 
输入 中 读 取 未 知 数量 的 数值 。 其 他 例子 包括 从 一 次 查找 中 收集 结果 集合 (我 们 事先 不 知道 结果 的 
总 数量 ) 以 及 从 数据 集合 中 依次 删除 元 素 。 因 此 , 我 们 所 面临 的 问题 不 是 我 们 是 否 应 该 处 理 容器 
大 小 的 变化 , 而 是 如 何 处 理 这 样 的 变化 。 

为 什么 我 们 需要 做 这 些 事 情 呢 ? 为 什么 不 “一 次 性 分 配 足 够 的 内 存 ”? 这 看 起 来 是 一 种 最 简 
单 且 最 有 效率 的 策略 。 然 而 , 这 一 策略 能 够 实现 , 仅 当 我 们 能 够 根据 需要 可 靠 地 分 配 足 够 的 内 
存 , 并 避免 由 于 分 配 的 内 存 过 多 造成 浪费 一 一 实际 上 这 是 不 可 能 的 。 如 果 我 们 采用 了 这 种 策略 ， 
我 们 将 不 得 不 重 写 代 码 (如 果 我 们 认真 并 系统 地 检查 溢出 错误 ) 或 者 疲 于 应 付 由 这 种 策略 带 来 的 
麻烦 ( 如果 我 们 在 检查 方面 比较 粗心 的 话 )。 

显然 , 并 不 是 所 有 的 vector 具有 相同 类 型 的 元 素 。 我 们 需要 使 用 vector 存储 double 类 型 的 数 
值 、 温度 数据 、 记 录 ( 各 种 类 型 )、 字 符 串 、 操作、GUI 按钮 、 形 状 、 日 期 窗口 指针 等 。 

容器 的 类 型 多 种 多 样 。 这 一 点 非常 重要 ,由 于 它 有 一 些 重要 的 含义 , 因此 不 应 该 不 加 思 
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考 就 接受 它 。 除 了 vector, 我 们 为 什么 还 需要 其 他 类 型 的 容器 呢 ? 如 果 我 们 只 使 用 一 种 类 型 
的 容器 (如 vector) , 我 们 就 只 需要 将 所 有 精力 用 于 实现 该 容器 , 并 可 以 将 它 作 为 编程 语言 的 
一 部 分 实现 。 如 果 我 们 只 使 用 一 种 容器 , 我 们 就 不 必 学 习 其 他 类 型 的 容器 。 我 们 可 以 总 是 
使 用 vector。 

对 于 大 多 数 重要 的 应 用 而 言 , 数据 结构 是 十 分 关键 的 。 大 量 的 书籍 阐述 了 应 该 如 何 组 织 数 
据 , 而 这 些 书籍 包含 的 知识 可 以 概括 为 对 这 一 问题 的 回答 :“ 我 们 怎样 才能 最 好 地 存储 自己 的 数 
据 ?” 因此 , 我 们 需要 使 用 不 同类 型 的 容器 。 到 目前 为 止 , 我 们 已 经 使 用 过 vector 和 string 类 型 
(string 是 存储 字符 的 容器 ) 。 在 第 20 章 , 我 们 还 将 学 习 list、map( map 用 于 存储 数值 对 ) 以 及 矩阵 
等 类 型 。 由 于 我 们 需要 使 用 各 种 类 型 的 容器 , 因此 学 习 用 于 建立 并 使 用 容器 的 编程 语言 特征 及 编 
程 技术 是 极为 有 用 的 。 

在 内 存 管理 的 最 底层 , 所 有 的 对 象 都 具有 固定 的 大 小 并 且 不 存在 类 型 的 概念 。 在 这 一 章 中 ， 
我 们 将 介绍 用 于 实现 容器 大 小 动态 改变 的 语言 特征 与 编程 技术 。 


19.2 改变 回 量 大 小 


为 实现 容器 大 小 的 动态 改变 , 标准 库 的 vector 类 型 采用 了 什么 方法 呢 ? 它 提供 了 三 种 简单 的 
操作 。 假 设 我 们 定义 


vector<double> v(m); /vsize()==n 
我 们 可 以 通过 三 种 方法 改变 v 的 大 小 : 


Vv.resize(10); lv now has 10 elements 


vpush_back(7); // add an element with thevalue 7 to the end of v 
I/ v.sizel() increases by 1 


VvV = V2; // assign another vector; v is now a copy of v2 


// v.sizel) now equals v2.size() 


针对 容器 大 小 的 动态 改变 , 标准 库 的 vector 类 型 提供 了 更 多 的 操作 ,如 erase( ) 和 insert( ) (附录 
B. 4.7), 但 在 本 章 中 我 们 只 考虑 如 何在 我 们 的 vector 类 型 中 实现 这 三 种 操作 。 


19. 2.1 方法 描述 


在 19. 1 节 中 , 我 们 介绍 了 实现 容器 大 小 改变 的 最 简单 的 策略 : 为 新 的 元 素数 量 分 配 存 储 空 
间 , 并 将 原 有 元 素 拷 贝 至 新 的 存储 空间 。 然 而 , 如 果 我 们 需要 经 常 调整 容器 大 小 , 这 一 策略 将 是 
低 效 的 。 在 实际 中 , 如 果 我 们 曾经 改变 了 容器 的 大 小 , 那么 以 后 我 们 很 可 能 还 需要 多 次 进行 这 样 
的 操作 。 例 如 , 我 们 很 少 只 进行 一 次 push_back( ) 操 作 。 因 此 , 针对 这 一 实际 情况 , 我们 可 以 对 程 
序 进行 优化 。 实 际 上 , 所 有 的 对 vector 类 型 的 实现 都 会 记录 vector 对 象 中 实际 包含 元 素 的 数量 以 
及 vector 对 象 为 “将 来 的 扩展 ”所 保留 的 空闲 存储 空间 的 总 量 。 例 如 : 


class vector { 
int sz; // number of elements 
double* elem; // address of first element 
int space; // number of elements plus “free space”/”“slots” 
// for new elements (“the current allocation”) 
public: 


ll... 
}; 


上 述 实现 可 以 由 下 图 表示 : 
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由 于 我 们 从 0 开始 统计 元 素 的 数量 , 那么 sz( 元 素数 量 ) 标 示 了 最 后 一 个 元 素 之 后 的 位 置 ,而 space 
标示 了 最 后 一 个 存储 单元 之 后 的 位 置 。 而 图 中 的 指针 则 标示 了 elem + sz 以 及 elem + space 的 位 置 。 
当 vector 对 象 被 构造 时 ,space 为 0, 如 下 图 所 示 。 在 这 里 , 我 们 不 会 分 配额 外 的 内 存 空间 ， 除 
非 我 们 需要 开始 改变 元 素 的 数量 。space == sz 意味 着 
此 时 的 vector 并 没有 额外 的 内 存 , 除非 我 们 使 用 push_ 
back( ) 操 作 。 : 
默认 构造 函数 (构造 不 包含 任何 元 素 的 vector 对 
象 ) 将 这 三 个 成 员 变 量 设 为 0: 
vector: :vector() :sz(0), elem(0), space(0) {} 
也 就 得 到 右面 的 图 。 图 中 所 示 的 存储 单元 是 虚构 的 ， 
实际 中 并 不 存在 。 上 默认 构造 函数 并 不 为 元 素 分 配 内 存 ， sz: 
且 只 占用 最 小 的 存储 空间 (参见 习题 16) 。 elem: 
请 注意 , 我 们 的 vector 类 型 所 采用 的 技术 可 以 用 于 
实现 标准 的 向 量 ( 或 其 他 数据 结构 ) , 但 在 我 们 的 系统 


中 , 标准 库 的 实现 std :: vector 可 能 采用 了 不 同 的 技术 。 
19. 2.2 reserve 和 capacity 


用 于 改变 vector 大 小 的 最 基本 的 操作 ( 即 改 变 元 素 的 数量 ) 是 vector :: reserve( ) 。 这 一 操作 可 
用 于 为 新 的 元 素 分 配 内 存 空 间 : 


void vector: :reserve(int newalloc) 


{ 






if (newalioc<=space) return; j never decrease allocation 
double* p = new double[newalloc]; //allocate new space 

for (int i=0; ji<sz; ++i) p[i] = elem[il; /copy old elements 
delete[] elem; // deallocate Gld space 
elem = p; 

space = newalloc; 


} 
注意 , 我 们 并 不 对 保留 空间 中 的 元 素 进行 初始 化 。 我 们 只 是 保留 存储 空间 以 备 将 来 使 用 ; 使 用 保 
留 空间 是 push_back( ) 和 resize( ) 的 工作 。 

显然 ,vector 对 象 中 保留 的 空闲 空间 的 大 小 对 于 用 户 可 能 是 有 用 的 , 因此 我 们 (与 标准 库 中 的 
vector 关 型 类 似 ) 提供 了 一 个 函数 以 获得 这 一 信息 : 

int vector: :capacity() const { return space; } 
也 吏 是 说 , 对 于 一 个 vector 对 象 v, v. capacity( ) - v. size( ) 代表 了 在 不 重新 分 配 存储 空间 的 前 提 
下 , 我 们 通过 push_back( ) 操作 能 够 向 v 添加 元 素 的 数量 。 


19.2.3 resize 
实现 了 本 数 reserve( ) 后 ,reszie( ) 的 实现 是 十 分 简单 的 。 我 们 只 需要 处 理 以 下 几 种 情况 : 
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。 容器 新 的 大 小 大 于 容器 原 有 的 分 配 空间 。 

。 容器 新 的 大 小 大 于 容器 当前 的 大 小 ， 但 小 于 或 等 于 容器 的 原 有 分 配 空 间 。 
e。 容器 新 的 大 小 等 于 容器 当前 的 大 小 。 

。 容器 新 的 大 小 小 于 容器 当前 的 大 小 。 

下 面 的 代码 展示 了 resize( ) 郴 数 的 实现 


void vector: :resize (int newsize) 
// make the vector have newsize elements 
// initialize each new element with the default value 0.0 


reserve(newsize); 
for (int i=sz; ji<newsize; ++i) elem[li] =0; /initialize new elements 
SZ = Newsize; 


) | 
我 们 使 用 函数 reserve( ) 处理 内 存 空间 的 管理 。 代 码 中 的 循环 将 初始 化 新 的 元 素 ( 如果 有 )。 

在 这 里 , 我 们 不 显 式 地 处 理 每 一 种 情况 。 但 你 可 以 验证 : 在 上 述 代码 中 , 每 一 种 情况 均 被 正 
确 地 处 理 了 。 

试 一 试 ” 如 果 我 们 想 要 证 明 上 述 resize( ) 是否 正确 ,那么 我 们 需要 考虑 (并 测试 ) 哪 

些 情 况 ? 当 newsize ==0 时 会 怎样 ? 当 newsize == -77 呢 ? 
19. 2.4 push_back 四 

表面 上 看 来 , push_back( ) 是 复杂 的 ， 难于 实现 。 实际 上 , 当 实 现 了 冰 数 reserve( ) 之 后 ， push_ 
back( ) 的 实现 是 相当 简单 的 : 


void vector::push_back(double d) 
// increase vector size by one:; initialize the new me with d 
{ 
if (space==0) reserve(8); . /start with space for 8 elements 
else if (sz==space) reserve(2*space); /get more space 
elem[szl = d; // add d at end 
十 十 SZ; // increase the size (sz is the number of elements) 


} . 
换 句 话说 ， 当 vector 对 象 没 有 空闲 的 内 存 空间 以 容纳 新 元 素 时 , 我 们 将 已 有 的 内 存 空间 扩大 一 售 。 
在 实际 中 , 这 种 内 存 空 间 的 扩大 策略 对 于 绝 大 多 数 的 vector 应 用 是 一 个 很 好 的 选择 , 并 且 这 种 策 
略 已 被 用 于 大 多 数 的 标准 库 vector 类 型 的 实现 。 
19.2.5 赋值 

我 们 可 以 采用 几 种 不 同 的 方法 实现 向 量 的 赋值 。 例 如 , 仅 当 赋值 涉及 的 两 个 向 量具 有 相同 的 
元 素数 量 时 , 我 们 才 可 以 判定 赋值 是 合法 的 。 然 而 , 在 18. 2.2 节 中 , 我 们 认为 向 量 赋值 应 具有 更 
为 通用 的 意义 : 当 赋 值 vl = v2 完成 后 , 向 量 vl 应 是 向 量 v2 的 副本 。 例 如 : 





显然 , 我 们 需要 拷贝 元 素 , 那么 向 量 对 象 所 包含 的 空闲 存储 空间 呢 ? 我 们 是 否 需 要 拷贝 空闲 
存储 空间 ? 我 们 不 需要 : 新 的 vector 对 象 将 会 获得 元 素 的 副本 , 但 由 于 我 们 不 确定 此 后 新 vector 
对 象 将 被 如 何 使 用 , 因此 我 们 不 会 对 对 象 的 空闲 存储 空间 进行 处 理 。 如 下 图 所 示 : 
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Handed back to 


V2: 





最 简单 的 实现 包括 如 下 操作 

。 为 副本 分 配 存储 空间 。 

。 拷贝 元 素 。 

。 删除 原 有 存储 空间 。 

e 更 新 sz、elem、space 的 值 。 
例如 : 


vector& vector: :operator=(const vector& a) 
// like copy constructor, but we must deal with old elements 


{ 
double* p = new double[a.sz]; // allocate new space 
for (int i = 0; i<a.sz; ++i) p[i] = a.elemli]; /copy elements 
delete[] elem; / deallocate old space 
space = SZ = a.SZ; / set new size 
elem = p; // set new elements 
return *this; // return self-reference 
} 


作为 惯例 , 赋值 操作 符 将 返回 关于 被 赋值 对 象 的 引用 。 符 号 * this 的 含义 参见 17. 10 节 。 

上 述 实 现 是 正确 的 , 但 通过 观察 我 们 可 以 发 现 上 述 实现 包含 了 大 量 多 余 的 存储 空间 的 分 配 与 
释放 操作 。 如 果 被 赋值 对 象 的 大 小 大 于 赋值 对 象 的 大 小 时 会 如 何 ? 如 果 被 赋值 对 象 的 大 小 等 于 
赋值 对 象 的 大 小 时 会 如 何 ? 在 很 多 应 用 中 , 后 一 种 情况 是 十 分 常见 的 。 在 这 两 种 情况 中 , 我 们 仅 
仅 只 需要 将 元 素 拷贝 至 目标 vector 对 象 : 


vector& vector: :operator=(const vector& a) 


{ - 
if (this==&a) return *this; // self-assignment no work needed 
if (a,sz<=space) { // enough space, no need for new allocation 
| for (int i = 0; i<a.sz; ++i) es =a. elemli]; / copy elements 
SZ = 3.SZ; 
return *this; 
} 
double* p = new double[a.sz]; / allocate new space 
for (int i = 0; i<a.sz; ++i) pli] = a.elem[il; // copy elements 
delete[] elem; // deallocate old space 
space = SZ = a.sZ; /set new size 
elem = p; // set new elements 
return *this; // return a self-reference 
} 


在 上 述 代码 中 , 我 们 首先 测试 自 引用 的 情况 (如 v=v); 在 这 种 情况 中 , 我 们 不 需要 做 任何 操作 。 
这 一 测试 在 逻辑 上 看 是 多 余 的 , 但 有 时 会 带 来 性 能 的 优化 。 上 述 代 码 展 示 了 在 成 员 函 数 中 通过 
this 指针 判断 参数 a 是 否 与 当前 对 象 是 同一 对 象 的 一 种 通用 方法 。 实 际 上 ,如 果 我 们 删除 了 
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this == &a, 代码 仍然 能 够 正确 地 工作 。 另 外 ,a. sz <= space 这 一 判断 也 是 为 手 代 码 的 优化 .如果 
我 们 删除 了 a. sze <= space, 代码 仍然 能 够 正确 地 工作 。 
19. 2.6 到 现在 为 止 我 们 设计 的 vector 类 

到 目前 为 止 , 我 们 差不多 已 经 完成 了 double 向 量 类 型 的 设计 ; 


Han almost real vector of doubles: 


class vector { 
和 
invariant: 
for 0<=n<sz elem[n] is element n 
sz<=space; 
if sz<space there is space for (space—sz) doubles after elem[sz—1] 
vf 
int sz; I/ the size 
double* elem; //pointer to the elements (or 0) 
int space; I/ number of elements plus number of free slots 
public: 


vector() : sz(0), elem(0), space(0) { } 
explicit vector(int s) :sz(s), elem(new double[s]), space(s) 


{ 

for (int i=0; i<sz; ++i) elem[i]=0;  //elements are initialized 
} 
vector(const vector&); ll copy constructor 
vector& operator=(const vector&); I copy assignment 


~Vector() { delete[] elem; } I destructor 


double& operator[ ](int n) { return elem[n]; } I access 
const double& operator[](int n) const { return elem[n]; } 


int size() const { return sz; } 
int capacity() const { return space; } 


void resize(lint newsize); I growth 
void push_back(double d); 
void reservelint newalloc); 
}; | 
请 注意 上 述 代码 是 如 何 实现 一 些 必 备 的 操作 的 (参见 18. 3 节 ) : 构造 函数 、 默认 构造 函数 、 拷贝 操 
作 、 析 构 函 数 。 上 述 vector 类 型 实现 了 元 素 访 问 操作 (通过 下 标 [ ] ) , 实现 了 获取 数据 信息 的 操作 


(size( ) 与 capacity( ) ) 以 及 实现 了 控制 容器 大 小 的 操作 (resize( ) 、push_back( ) 和 reserve( ) ) 。 
19. 3 模板 


但 在 实际 编程 中 , 我 们 可 能 不 仅仅 需要 double 向 量 ; 我 们 希望 能 够 自由 地 指定 vector 类 型 所 


包含 的 元 素 类 型 。 例 如 : 


Vector<double> 

Vector<int> 

vector<Month> 

vector<Window*> // vector of pointers to Windows 
vector< vector<Record>> //vector of vectors of Records 
vector<char> 


为 了 达到 目的 , 我 们 必须 知道 如 何 定义 模板 。 我 们 从 第 一 天 开始 就 已 经 会 使 用 模板 了 , 但 到 
目前 为 止 我 们 还 从 未 定义 一 个 模板 。 标 准 库 提供 了 需要 使 用 的 工具 , 但 我 们 仍然 需要 清楚 标准 库 
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的 设计 者 们 是 如 何 实现 诸如 vector 类 型 和 sort( ) 函数 这 些 工具 的 (参见 21. 1 节 和 附录 B. 5.4)。 对 
我 们 来 说 , 这 不 仅仅 是 理论 上 的 兴趣 ,因为 (通常 ) 标 准 库 所 采用 的 工具 和 技术 对 于 我 们 编写 自己 
的 代码 而 言 是 十 分 有 用 的 。 例 如 , 在 第 21 和 第 22 章 中 , 我 们 将 展示 模板 是 如 何 被 用 于 实现 标准 
库容 器 和 算法 的 。 在 第 24 章 , 我 们 将 展示 如 何 为 科学 计算 设计 矩阵 类 型 。 

本 质 上 说 , 模板 是 一 种 机 制 ， 它 使 程序 员 能 够 使 用 数据 类 型 作为 一 个 类 或 函数 的 参数 。 当 我 
们 将 数据 类 型 作为 参数 时 , 编译 器 将 会 根据 参数 生成 特定 的 类 或 水 数 。 
19. 3.1 类 型 作为 模板 参数 

我 们 希望 使 vector 类 型 所 包含 的 元 素 类 型 能 够 成 为 vector 类 型 的 参数 。 因 此 , 在 我 们 实现 的 
vector 类 型 中 , 用 T 取代 double, 其 中 TT 是 一 个 参数 且 它 能 被 赋予 诸如 double、int、string、vector 


< Record > 和 Window 之 类 的 “ 值 ”"。 在 C++ 中 , 引 人 类 型 参数 T 的 符号 为 template < class T> 前 
缀 ,这 一 符号 的 含义 是 “对 于 所 有 类 型 T”。 例 如 ， 


/an almost reaj vector of Ts: 
tempiate<class T> class vector { //read “for ail types T” (just {like in math) 


int sz; / the size 和 
T* elem; // a pointer to the elements 
int space;  //sizetfree_space 

pubilic: 


vector() : sz(0), elem(0), space(0) {} 
explicit vector(int s); 


vector(const vector&); h copy constructor 
vector& operator=(const vector&); / copy assignment 
~vector() { delete[] elem; } // destructor 


T& operator[](int n) { return elemIn]; } //access: return reference 
const T& operatorl](int mn) const { return elem[n]; } 


int size() const { return sz; } / the current size 
int capacity() const { return space; } 


void resizelint newsize); // growth 
void push_back(const T& d); 
void reservelint newalloc);. 

}; 


上 述 代 码 中 , 我 们 将 在 19. 2. 6 节 实 现 的 double 的 vector 类 型 中 的 double 类 型 替换 为 模板 参数 
T。 我 们 可 以 通过 如 下 方式 使 用 类 模板 vector: 


vector<double> vd; ATis double 
vector<int> vi; HTisint 
vector<double*>vpd; . /Tis double* 


vector< vector<int> >vvi; WT is vector<int>, in which TT is int 
当 我 们 使 用 模板 时 ， 我 们 可 以 认为 编译 器 是 按照 如 下 方式 产生 类 的 : 编译 器 用 实际 类 型 取代 
模板 参数 。 例 如 ， 当 编译 器 遇见 代码 中 的 vector < char > 时, 它 将 产生 如 下 代码 : 


class vector_char { 
int sz; /the size 
char* elem; //a pointer to the elements 
int space;  //sizetfree_space 
public: 
vector_char(); 
explicit vector_char(int s); 
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vector_char(const vector_char&); / copy constructor 
vector_char& operator=(const vector_char &); / copy assignment 


~Vector char (); // destructor 


char& operator[] (int n); // access: return reference 
const char& operator[j (int n) const; 


int size() const; // the current size 
int capacity() const; 
void resize(int newsize); // growth 


void push_back(const char& d); 
void reserve(int newalloc); 


}; 

对 于 vector < double > ,编译 器 产生 的 代码 与 19. 2. 6 节 中 的 代码 类 似 (其 中 将 使 用 一 个 合适 的 
内 部 名 称 表 示 vector < double > ) 。 

我 们 有 时 称 类 模板 为 类 型 生成 器 , 称 通过 指定 类 模板 的 模板 参数 的 方式 生成 类 型 (类 ) 的 过 程 


为 特例 或 模板 实例 化 。 例 如 ,vector < char > 和 vector < Poly_line “> 称 为 vector 的 特例 。 在 简单 的 
情况 下 ， 如 vector 类 型 , 实例 化 是 一 个 简单 的 过 程 。 而 在 最 普遍 、 最 高 级 的 情况 下 , 模板 实例 化 是 
一 个 相当 复杂 的 过 程 。 华 运 的 是 , 模板 实例 化 的 复杂 性 是 编译 器 设计 者 而 不 是 模板 使 用 者 需要 解 
决 的 问题 。 模 板 实例 化 (生成 模板 特例 ) 只 占用 程序 的 编译 时 间或 链接 时 间 , 而 不 会 占用 程序 运行 
时 间 。 

目 然 , 我 们 也 可 以 使 用 类 模板 的 成 员 函 数 。 例 如 : 

void fct(vector<string>& v) 

{ 

int n = v.size(); 
.Vv.push_back("Norah™); 


hl... 
} 


当 使 用 类 模板 的 成 员 函 数 时 , 编译 器 将 生成 合适 的 了 渔 数 。 例 如 ， 当 编译 器 遇见 v. push_back 
(“Norah” ) 时 , 它 会 根据 模板 定义 如 下 : 


void vector<string>::push_back(const string& d) {/* ...*/)} 


生成 函数 

template<class T> void vector<T>::push_back(constT& d) {/* ,..*/); 

这 样 ， 就 得 到 一 个 函数 以 实现 v push_back( ”Norah ) 调用 。 换 句 话 说 ， 当 你 需要 使 用 函数 处 
理 某 一 特定 类 型 的 参数 时 , 编译 器 将 会 根据 模板 为 你 生成 一 个 函数 。 

你 可 以 在 模板 中 使 用 template < typename T > 代替 template < class T> 。 两 者 完全 相同 , 但 有 些 
人 言 欢 typename,“ 因为 它 的 含义 更 清楚 "并 且 “ 因为 没 人 会 被 typename 这 一 名 称 迷惑 ， 没 人 会 认 
为 不 能 使 用 内 建 类 型 (如 int) 作为 模板 参数 " 。 我 们 认为 class 这 一 名 称 已 经 包含 了 类 型 的 含义 ， 
因此 使 用 class 并 没有 什么 不 好 。 而 且 , 关键 字 class 要 更 短 些 。 
19. 3.2 江 型 编程 

在 C++ 中, 模板 是 泛 型 编程 的 基础 。 实 际 上 , C++ 中 “ 泛 型 编程 ”的 定义 就 是 “使 用 模板 ”， 
虽然 这 样 的 定义 有 点 太 单 纯 了 。 我 们 不 应 根据 编程 语言 的 特征 定义 基本 的 编程 概念 。 编 程 语言 
的 特征 主要 用 于 支持 编程 技术 一 一 而 不 是 相反 的 。 和 其 他 的 热门 概念 一 样 ,“ 泛 型 编程 ”存在 多 种 
定义 。 我 们 认为 简单 的 、 最 有 用 的 定义 是 : 
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泛 型 编程 : 编写 能 够 正确 处 理 各 种 不 同 数据 类 型 参数 的 代码 ， 只 要 参数 的 数据 类 型 满足 特定 
的 语法 和 语义 要 求 。 

例如 ，vector 的 元 素 必须 是 能 够 实现 拷贝 的 数据 类 型 (通过 拷贝 构造 和 拷贝 赋值 实现 )。 在 第 
20 和 21 章 , 我 们 将 介绍 要 求 参数 支持 算术 运算 的 模板 。 当 我 们 参数 化 的 是 一 个 类 时 ,就 获得 一 
个 类 模板 ,通常 也 称 为 参数 化 的 类 型 或 者 参数 化 的 类 。 当 我 们 参数 化 的 是 一 个 肾 数 时 , 我 们 将 获 
得 函数 模板 , 通常 也 称 为 参数 化 的 函数 , 有 时 也 称 为 算法 。 因 此 , 泛 型 编程 有 时 称 为 "面向 算法 的 
编程 ”; 其 设计 的 重点 在 于 算法 的 实现 而 非 算法 所 使 用 的 数据 类 型 。 

由 于 参数 化 数据 类 型 的 概念 是 编程 的 核心 , 我 们 需要 进一步 探讨 这 个 有 些 让 人 困惑 的 术语 。 
这 样 ， 当 我 们 在 其 他 场合 中 再 次 碰见 这 一 概念 时 ， 才 不 会 感到 困惑 。 

泛 型 编程 依赖 于 显 式 模板 参数 的 形式 通常 称 为 参数 化 多 态 。 相 反 ， 从 类 层次 结构 与 虚 函 数 中 
获得 的 多 态 称 为 专用 多 态 , 而 这 一 类 型 的 编程 称 为 面向 对 象 的 编程 ( 见 14.3 和 14.4 节 )。 之 所 以 
两 类 编程 都 称 为 多 态 是 因为 每 种 类 型 都 依赖 于 程序 员 通 过 一 个 单一 的 接口 表示 一 个 概念 的 多 个 
版 本 。 多 态 在 希腊 语 中 是 “多 种 形状 ” 的 意思 , 这 意味 着 你 可 以 通过 一 个 通用 的 接口 就 能 操纵 多 个 
不 同 的 数据 类 型 。 在 第 16 ~ 19 章 的 Shape 例子 中 , 我 们 可 以 通过 接口 Shape 访问 多 种 形状 (如 
Text 、Circle 和 Polygon) 。 当 我 们 使 用 vector 时 , 通过 定义 为 vector 模板 的 接口 使 用 不 同类 型 的 vec- 
tor( 如 vector < int > 、vector < double > 和 vector < Shape” > ) 。 

面向 对 象 的 编程 (使 用 类 层次 结构 和 虚拟 函数 ) 和 泛 型 编程 (使 用 模板 ) 之 间 存 在 几 个 差异 。 
最 明显 的 差异 是 , 在 一 般 编 程 当 中 , 被 调用 痛 数 的 选择 由 编译 器 在 编译 时 确定 ,而 在 面向 对 象 的 
编程 当中 ,也 数 的 选择 在 程序 运行 过 程 中 确定 。 例 如 : 


v.push_back(x); /put x into the vector vy 
s.drawf); // draw the shapes 


对 于 v push_back (x), 编译 右 将 决定 v 的 元 素 类 型 并 采用 对 应 的 push_back( ) ; 而 对 于 s. draw( ) ， 
编译 器 将 会 间接 调用 某 一 draw( ) 函数 (使 用 s 的 vitbl, 参见 14. 3. 1 节 ) 。 这 一 差异 使 得 面向 对 象 
的 编程 比 泛 型 编程 更 为 灵活 , 但 泛 型 编程 更 为 规则 , 更 容易 理解 ,能 被 更 好 地 执行 (因此 使 用 单词 
“专用 ”和 “参数 化 ”进行 区 分 ) 。 

让 我 们 对 上 述 内 容 进行 总 结 : 

。 泛 型 编程 : 以 模板 为 基础 ,依靠 程序 编译 时 的 解析 。 

。 面向 对 象 的 编程 : 以 类 层次 结构 和 虚 函 数 为 基础 , 依靠 程序 运行 时 的 解析 。 

将 这 两 种 类 型 的 编程 相 结 合 是 可 能 的 也 是 有 用 的 。 例 如 ， 


void draw_all(vector<Shape*>& v) 
{ 
for (int i=0; i<v.size(0); ++i) vii]->draw(); 


} 
在 上 述 代 码 中 , 我 们 调用 了 基 类 Shape 的 一 个 虚 函 数 (draw( ) ) 一 一 这 是 面向 对 象 的 编程 。 然 


而 , 我 们 将 Shape* 类 型 的 指针 存放 在 一 个 vector 对 象 之 中 ,Shape* 是 参数 化 类 型 ， 因 此 我 们 在 进 

行 泛 型 编程 。 

所 以 (假设 你 的 头脑 中 现在 充满 了 哲学 思想 ) 人 们 为 什么 使 用 模板 ? 为 了 无 与 伦比 的 灵活 性 

和 性 能 ， 

。 在 对 性 能 要 求 高 的 场合 中 使 用 模板 ( 例如, 数值 计算 和 硬 实时 ; 参见 第 24 和 25 章 ) 。 

。 在 需要 灵活 地 组 合 不 同类 型 信息 的 场合 中 使 用 模板 (如 C++ 标准 库 ; 参见 第 20 和 21 
章 )。 
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模板 具有 很 多 有 用 的 特性 , 例如 高 灵活 性 和 近似 最 优 的 性 能 , 但 不 幸 的 是 它们 并 不 是 最 优 
的 。 与 其 他 方法 一 样 , 模板 也 有 对 应 的 缺点 。 对 于 模板 , 主要 的 问题 在 于 模板 所 带 来 的 灵活 性 和 
性 能 是 以 模板 内 部 (模板 的 定义 ) 和 模板 接口 (模板 的 声明 ) 的 分 离 作为 代价 的 。 模 板 所 带 来 的 拙 
劣 的 出 错 诊断 证 明了 这 一 问题 的 存在 一 程序 可 能 会 显示 大 量 拙劣 的 出 错 信息 。 通 常 ， 在 编译 过 
程 中 , 这 些 出 错 信息 出 现 的 时 间 要 比 我 们 希望 的 更 晚 。 

当 编 译 一 个 使 用 模板 的 代码 时 ,编译 器 将 查看 模板 以 及 模板 的 参数 类 型 。 编 译 器 这 么 做 的 目 
的 在 于 获得 足够 的 信息 以 生成 优化 代码 。 为 了 使 这 些 信息 可 用 ,编译 器 试图 要 求 模板 必须 在 它 被 
使 用 的 位 置 完 全 定义 , 包括 模板 的 所 有 成 员 函 数 以 及 在 这 些 成 员 函 数 中 调用 的 所 有 模板 函数 。 因 
此 , 模板 的 设计 者 会 试图 将 模板 的 定义 放置 在 头 文件 之 中 。 虽 然 C++ 标准 并 不 要 求 必 须 这 么 做 ， 
但 我 们 建议 读者 这 么 做 : 对 于 将 在 多 个 翻译 单元 中 使 用 的 模板 , 它 的 定义 应 包含 在 头 文件 之 中 。 

开始 时 , 你 可 以 只 编写 十 分 简单 的 模板 并 小 心地 逐步 改进 以 获得 相关 经 验 。 一 种 有 用 的 开发 
技术 是 : 就 像 我 们 编写 vector 类 型 一 样 , 首先 ,编写 并 测试 使 用 某 一 特定 数据 类 型 的 类 。 当 这 一 
步 成 功 之 后 , 用 模板 参数 替代 代码 中 的 特定 数据 类 型 。 出 于 一 般 性 、 类 型 安全 性 以 及 性 能 考虑 ， 
我 们 应 使 用 基于 模板 的 库 , 如 C++ 标准 库 。 第 20 和 21 章 将 会 介绍 标准 库 中 的 容器 和 算法 , 并 通 
过 例子 介绍 模板 的 使 用 方法 。 

19. 3.3 容器 和 继承 

人 们 总 是 尝试 采用 下 面 这 种 结合 了 面向 对 象 编程 和 泛 型 编程 的 方式 : 将 包含 派生 类 对 象 的 容 

器 以 包含 基 类 对 象 的 容器 的 形式 使 用 。 然 而 , 这 一 方式 是 错误 的 。 例 如 : 


vector<Shape> vs; 

vector<Circle> vc; 

VS = VC; // error: vector<Shape> required 
void f(vector<Shape>&); 

f(ve); / error: vector<Shape> required 


但 是 为 什么 这 一 方式 是 错误 的 呢 ? 也 许 你 会 说 我 能 够 将 一 个 Circle 对 象 转化 为 一 个 Shape 对 
象 。 实 际 上 , 你 不 能 这 么 做 。 你 可 以 将 Circle” 转化 为 Shape”, 或 者 将 Circle& 转化 为 Shape& , 但 
我 们 已 经 有 意 地 避免 了 Shape 对 象 之 间 的 赋值 , 因此 你 可 能 想 知道 当 你 将 一 个 拥有 半径 的 Circle 
对 象 赋值 给 一 个 不 具有 半径 属性 的 Shape 变量 时 , 将 会 发 生 什么 (参见 14.2.4 节 )。 假 如 我 们 允 
许 它 发 生 , 将 会 发 生 所 谓 的 “截断 "现象 , 与 整数 截断 (参见 3. 9.2 节 ) 本 质 上 等 价 的 对 象 截断 。 
因此 , 我 们 试图 通过 采用 指针 修改 上 述 代 码 , 如 下 所 示 : 


Vector<9Shape*> vps; 

vector<Circle*> vpc; 

vps = vpc; Werror: vector<Shape*> required 
void f(vector<Shape*>&); 

flvpc); // error: vector<Shape*> required 


这 一 次 , 系统 仍然 报错 ; 为 什么 呢 ? 看 一 看 f( ) 可 能 会 做 些 什么 ; 


void f(vector<Shape*>& v) 


v.push_back(new Rectangle(Point(0,0),Point(100,100))); 
} 


显然 , .我 们 可 以 将 一 个 Rectangle* 指针 放 人 和信 vector < Shape”> 。 但 是 ， 如果 这 个 vector <Shape”> 
对 象 在 别 的 地 方 被 解释 为 一 个 vector < Circle”> 对 象 时 , 可 能 会 得 到 出 人 意料 的 糟糕 结果 。 特 别 
地 , 假设 上 述 例子 能 够 在 编译 器 中 成 功 编译 , 那么 在 vpc 中 存放 Rectangle” 指 针 会 产生 什么 结果 
呢 ? 继承 是 一 种 强大 且 微 妙 的 机 制 ， 而 模板 并 没有 向 继承 扩展 。 有 几 种 方法 能 够 通过 使 用 模板 表 
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示 继 承 , 但 这 些 内 容 不 在 本 书 的 介绍 范围 之 内 。 我 们 只 需要 记 住 , 对 于 任何 模板 C 而 言 ， 0 
B” 并 不 意味 着 “C<D> 是 C<B>" 一 一 并 且 我 们 通过 这 一 准则 避免 偶尔 的 类 型 违例 。 参 见 
25. 4.4 节 。 : 
19. 3.4 ”整数 作为 模板 参数 

显然 , 通过 类 型 使 类 参数 化 是 有 用 的 。 那 么 , 通过 “其 他 东西 ”使 类 参数 化 又 如 何 呢 ， 如 整数 
值 和 字符 串 值 ? 本 质 上 来 说 , 任何 参数 种 类 都 是 有 用 的 , 但 在 本 节 中 我 们 只 考虑 以 数据 类 型 和 整 
数 作为 参数 。 其 他 的 参数 种 类 并 不 像 这 两 种 参数 那么 有 用 ， 并 且 在 ee 在 使 用 其 他 参数 类 别 
前 通常 需要 了 解 关 于 它们 的 语言 特征 的 细节 。 

下 面 讨论 一 个 使 用 整数 值 作 为 模板 参数 的 最 常见 的 例子 : 一 个 容器 所 包 合 的 元 素 儿 量 在 编译 


时 已 经 被 确定 : 
template<class T, int N> struct array { 
T elem[N]; / hold elements in member array 


// rely on the default constructors, destructor, and assignment 


T& operator[] (int n); // access: return reference 
const T& operator[] (int n) const; 


T* data() { return elem; } // conversion to T* 
const T* data() const { return etem; } 


int size() const { return N; } 
}; 
我 们 能 够 按 如 下 方式 使 用 上 述 array( 参 见 20.7 节 ) : 
array<int,256> gb;  //256 integers 


array<double,6> ad = {0.0, 1.1, 2.2, 3.3, 4.4, 5.5}; //note the initializer! 
const int max = 1024; 


void some_fct(int n) 
{ 
array<char, max> loc; 
array<char,n> oops; // error: the value of n not known to compiler 
Ms 
array<char,max> loc2 = loc; // make backup copy 


loc = loc2; // restore 


} . 
显然 , array 是 很 简单 的 ( 比 vector 更 简单 但 实现 的 功能 更 有 限 ) 。 那 么 , 为 什么 人 们 希望 使 用 array 
而 不 是 vector 呢 ? 一 种 答案 是 “效率 ”。 我 们 在 编译 时 就 已 经 知道 array 的 大 小 ， 因 此 编译 器 将 会 
分 配 静 态 内 存 ( 为 全 局 对 象 , 如 gb) 和 栈 内 存 ( 为 局 部 变量 , 如 loc ) 而 不 是 在 自由 空间 中 分 配 内 存 
空间 。 当 我 们 进行 范围 检查 时 ,检查 可 根据 已 知 常数 (参数 N) 进行 。 对 于 大 多 数 程序 而 言 ， 效 率 
的 提高 并 不 是 十 分 重要 的 , 但 如 果 我 们 编写 的 是 一 个 关键 的 系统 组 件 , 例如 网 络 驱动 , 那么 程序 
的 效率 就 变 得 十 分 重要 了 。 更 重要 的 是 ， 有 些 程序 可 能 不 允许 使 用 自由 空间 。 这 类 程序 通常 属于 
散 入 式 系 统 的 程序 和 /或 安全 性 要 求 严格 的 程序 (参见 第 25 章 )。 在 这 类 程序 中 , array 在 处 理 临 
界限 制 时 (不 使 用 自由 空间 ) 要 比 vector 更 具有 优势 。 z 

现在 考虑 一 个 相反 的 问题 : 不 是 “为 什么 我 们 不 只 使 用 vector” 而 是 “为 什么 不 使 用 内 建 的 数 
组 ”? 如 我 们 在 18.5 节 中 所 见 , 使 用 数组 容易 造成 错误 : 数组 不 知道 它们 自身 的 大 小 , 它们 能 够 
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很 容易 地 转化 为 指针 , 它们 不 能 进行 彼此 间 的 直接 拷贝 ; 而 array 不 存在 这 些 间 题 。 例 如 3 
double* p =ad; I error: no implicit conversion to pointer 
double* q = ad.data(); I OK: explicit Conversion 
template<class C> void printout(const C& c) 
for (int i = 0; i<c.size(); ++i) cout << cl[i] <<"\n'; 
} 


与 vector 类 型 类 似 , 我 们 能 够 对 array 调用 函数 printout( ) : 
printout(ad); I call with array 
Vector<int> vi; 
Ni: 
printout(vi); I call with vector 


这 是 一 个 将 泛 型 编程 应 用 于 数据 访问 的 简单 例子 。 这 有 段 代 码 能 够 正确 运行 的 原因 在 于 array 
和 vector 类 型 的 接口 (size( ) 和 下 标 操作 ) 是 相同 的 。 第 20 和 21 章 将 会 详细 介绍 这 种 编程 风格 。 
19. 3.5 模板 参数 推导 

对 于 类 模板 ， 当 你 生成 某 一 特定 类 的 对 象 时 , 你 需要 指定 模板 参数 。 例 如 : 


array<char,1024> buf; I for buf, T is char and N is 1024 
array<double,10> b2; I for b2, T is double and N is 10 


对 于 函数 模板 ， 编 译 上 大 通常 能 够 从 函数 的 参数 中 推断 出 模板 参数 。 例 如 : 


template<classT int N> void fll(array<TN>& b, const T& val) 


for (int i = 0; i<N; ++i) b[i] = val; 


} 
void f() 
{ 
fillbuf, x'); H for fill0), T is char and N js 1024 
I because thats what buf has 
fill(b2,0.0); I for fill(), T is double and N is 10 
I!/ because thats what b2 has 
} 


在 技术 上 , fil(buf, 'x'") 是 fl < char，1024 > (buf,'x') 的 简写 , fill(b2, 0) 是 fll < double， 
10 > (b2, 0) 的 简写 。 幸 运 的 是 , 我 们 并 不 需要 按照 这 一 规定 编写 代码 。 编 译 器 能 够 自动 为 我 们 
做 这 些 事情 。 
19. 3.6 一 般 化 vector 类 z 

当 我 们 将 “包含 double 型 元 素 的 vector” 类 推广 至 “包含 T 类 型 元 素 的 vector "模板 时 , 我 们 并 
没有 重新 考虑 函数 push_back( ) 、resize( ) 和 reserve( ) 的 定义 。 现 在 , 我 们 必须 做 这 些 事 情 了 , 因 
为 在 19.2.2 节 和 19.2.3 节 中 , 这 些 函 数 的 实现 采用 了 一 些 假设 , 而 这 些 假设 对 double 元 素 类 型 
是 成 立 的 , 但 并 不 是 对 所 有 其 他 的 元 际 类 型 都 是 成 立 的 : 

se 如 果 X 类 型 没有 默认 值 , 应 如 何 处 理 vector <X>? 

e 当 vector 对 象 使 用 完毕 时 ， 如 何 确 保 对 象 的 元 素 被 销毁 了 ? 

我 们 必须 得 解决 这 些 问题 吗 ? 我 们 可 能 会 说 ,“ 不 要 用 不 具有 上 默认 值 的 类 型 设置 vector 的 元 
素 类 型 " 以 及 “不 要 将 vector 用 于 带 有 可 能 产生 问题 的 析 构 函数 的 类 型 "。 对 于 一 个 以 “通用 ”为 目 
标的 工具 , 上述 限制 对 用 户 而 言 是 相当 苦恼 的 , 并 且 会 使 用 户 产生 这 样 的 印象 ; 工具 的 设计 者 没 
有 全 面 考虑 问题 或 者 没有 考虑 用 户 的 需求 。 通 常 ,这样 的 猜疑 是 正确 的 , 但 是 在 标准 库 的 设计 者 
实现 的 代码 中 并 不 存在 这 些 问 题 。 为 了 构造 与 标准 库 vector 相同 的 类 型 ,必须 解决 这 些 问 题 。 


404 筑 三 部 分 ”发 据 结 药 和 章法 


对 于 不 具备 默认 值 的 类 型 , 我 们 设置 了 一 个 选项 , 已 经 在 我 们 需要 默认 值 时 能 够 指定 该 类 型 
的 默认 值 : 
template<class T> void vector<T>::resize(int newsize, T def = TO); 


也 就 是 说 , 除非 用 户 指定 了 默认 值 , 否则 使 用 T( ) 作 为 默认 值 。 例 如 : 


vector<double> v1; 

v1i.resize(100); // add 100 copies of doubje0, that is, 0.0 

vi.resize(200, 0.0); /Wadd 100 copies of 0.0 一 mentioning 0.0 is redundant 
vi.resize(300, 1.0);  //add 100 copies of 1.0 


struct No_default { 
No_default(int);  // the only constructor for No_default 
Hens 

}»; 


vector<No_default> v2(10);  //error: tries to make 10 No_defauit0s 
vector<No_default> v3; 

V3,.resize(100, No_default(2));  //add 100 copies of No_defauit(2) 
V3.resize(200); f/f error: tries to make 100 No_default0s 


析 构 函数 的 问题 要 更 难于 解决 。 实 际 上 , 我 们 需要 处 理 这 样 的 数据 结构 : 同时 包含 已 被 初始 
化 数据 和 未 被 初始 化 数据 的 数据 结构 。 到 目前 为 止 , 我 们 已 经 知道 如 何 避 免 未 初始 化 数据 以 及 由 
此 产生 的 问题 。 现 在 (作为 vector 的 实现 者 ) 我 们 不 得 不 面 对 这 一 问题 , 使 得 我 们 (vector 的 用 户 ) 
不 需要 在 实际 应 用 中 自己 解决 这 些 问 题 。 

首先 , 我 们 需要 寻找 一 种 获得 并 管理 未 初始 化 内 存 空间 的 方法 。 幸运 的 是 ， 标准 库 为 我 们 提 
供 了 allocator 类 ,该 类 能 够 提供 未 初始 化 内 存 。 下 面 代 码 给 出 了 allocator 的 一 个 简化 版 本 : 


template<class T> class allocator { 

Pubjic: 
Wa 
T* allocate(int n); // allocate space for n objects of type T 
void dealiocate(T* p, int n); // deallocate n objects of typeT starting at p 


void construct(T* p, const T& v);  //constructaT with the value v in p 
void destroy(T* p); // destroy theTin p 
}; 
如 果 你 想 了 解 细节 信息 , 那么 请 参考 (The C++ Programming Language》 中 的 <memory > (参见 附录 
B. 1.1) 中 的 内 容 , 或 者 参考 C++ 标准 。 尽 管 如 此 ,， 上面 所 列 的 4 个 基本 操作 使 我 们 能 够 实现 ; 
。 分 配 能 够 容纳 类 型 T 的 一 个 对 象 的 未 初始 化 内 存 空间 。 
。 在 未 初始 化 空间 中 构造 类 型 T 的 对 象 。 
。 销毁 类 型 T 的 对 象 , 并 将 其 所 占 内 存 设 置 为 未 初始 化 状态 
。 释放 能 够 容纳 类 型 T 的 一 个 对 象 的 未 初始 化 内 存 空 间 。 
allocator 正 是 我 们 实现 vector <T > :: reserve( ) 需要 使 用 i 我 们 可 以 向 vector 传递 一 个 
分 配器 参数 : 
template<class T, class A = allocator<T> > class vector { 
Aalioc;  //use allocate to handle memory for elements 


i... 
); 


除了 提供 分 配器 (并 默认 使 用 标准 的 分 配器 而 不 是 使 用 new) ,一 切 与 前 面 的 reserve( ) 实现 完 
全 相同 。 作 为 vector 的 用 户 , 我 们 可 以 忽略 分 配器 , 直至 vector 能 够 按照 一 种 与 众 不 同 的 方法 管 
理 其 元 素 占 用 的 内 存 空间 。 作 为 vector 的 实现 者 、 试图 理解 基本 问题 和 基本 技术 的 学 习 者 , 我 们 
必须 明白 vector 对 象 是 如 何 处 理 未 初始 化 内 存 并 为 其 用 户 构造 合适 的 对 象 的 。 与 之 相关 的 代码 是 
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vector 中 直接 处 理 内 存 的 成 员 肾 数 ,， 如 vector <T > :: reserve( ): 


template<class T, class A> 

void vector<TA>::reservelint newalloc) 

{ 
if.(newalloc<=space) return; / never decrease allocation 
T* p = alloc.allocate(newallioc); // allocate new space 
for (int i=0; i<sz; ++i) ailoc.construct(&p[i,elem[i); /copy 


for (int i=0; i<sz; ++i) alloc.destroy(&elerm[i]); / destroy 
alloc.deallocate(elem,space); / deallocate old space 
elem = p; 


space = newalloc; 


} 

我 们 将 元 素 找 贝 至 未 初始 化 的 内 存 空间 形成 元 素 的 新 副本 ， 并 销毁 原 有 的 元 素 。 因 为 对 于 诸 
如 string 之 类 的 类 型 赋值 总 是 假设 目标 空间 已 被 初始 化 , 因此 在 这 种 情况 下 我 们 不 能 使 用 赋值 。 

实现 了 reserve( ) 之 后 , vector <T, A > :: push_back( ) 就 容易 实现 了 ， 


template<class T, class A> 
void vector<T,A>::push_back(const T& val) 


{ 
if (space==0) reserve(8); // start with space for 8 elements 
else if (sz==space) reserve(2*space); // get more space 
alloc.construct(&elem[sz],vai); // add val at end 
++SZ; | / increase the size 

} 

类 似 地 ,vector <T，A > : :resize( ) 也 不 难 实现 ; 

tempiate<class T, class A> 

void vector<TA>::resize(int newsize, T val = T{)) 

{ 
reserve(newsize); 
for (int j=sz; icnewsize; ++i alloc.construct(&elem[i],val); // construct 
for (int i = newsize; i<sz; ++i) alloc.destroy(&elem[i]); / destroy 
SZ = Newsize; 

} ; 


注意 , 由 于 有 些 类 型 没有 默认 的 构造 函数 ， 因此 需要 提供 一 个 选项 以 使 我 们 能 够 为 元 素 指 定 
一 个 默认 值 。 : 

当 我 们 试图 减 小 当前 的 vector 时 , 在 这 种 情况 下 , 我 们 还 需要 考虑 "多 余 元 素 "” 的 析 构 了 天数 。 
析 构 函数 可 以 被 认为 是 能 够 实现 将 一 个 具有 类 型 的 对 象 转变 为 “原始 内 存 " 的 工具 。 

在 代码 中 “融入 分 配器 ”是 C++ 编程 的 高 级 知识 , 可 以 将 这 一 内 容 放 在 一 边 , 除非 我 们 对 
C++ 已 有 足够 的 了 解 。 


19.4 范围 检查 和 异常 


回顾 我 们 目前 实现 的 vector, 我 们 会 发 现 我 们 没有 对 数据 访问 进行 范围 检查 。 Operator|[ ] 的 实 
现 十 分 简单 : 四 

template<class T, class A> T& vector<T,A>::operator[](int m) 

{ 


return elem[n]， 


} 
所 以 , 下 面 这 些 代码 存在 错误 : 


vector<int> v(100); 

v[~200] = v[200]; // oops! 

int i; 

Cin>>i; 

v[i] = 999; / maul an arbitrary memory location 
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上 述 代码 能 够 通过 编译 运行 , 并 能 够 访问 不 属于 vector 对 象 的 内 存 空间 。 这 可 能 会 造成 严重 
的 问题 ! 在 实际 程序 中 , 这 样 的 代码 是 不 可 接受 的 。 下 面 我 们 将 完善 vector 以 处 理 这 些 问题 。 最 
简单 的 方法 是 增加 一 个 用 于 访问 检查 的 操作 at( ) : 


struct out_of range {/*...*/}; /class used to report range access errors 


template<class T, class A = allocator<T> > class vector { 
Ws 


T& at(int n); // checked access 
const T& at(int n) const; // checked access 
T& operator[](int n); H unchecked access 


const T& operator[](int n) const;  //unchecked access 
/a 
}; 


template<class T, class A > T& vector<T,A>::at(int n) 
{ 

if (n<0 || sz<=n) throw out_of_range(); 

return elem[n]; 


} 


template<class T, class A > TA vector<T,A>::operator[](int n) /as before 
{ 
return elem[n]; 


} 
当 实 现 了 at( ) 操 作 后 , 我 们 可 以 编写 如 下 代码 : 


void print_some(vector<int>& v) 
{ 
inti = -1; 
cin >> i; 
while(il= -1) try { 
cout << vI" << 1<< "1]==" << vat() << \n''; 


catch(out_of_range) { 
cout << "bad index: " <<i << "\n"; 
} 
} 


在 上 面 的 代码 中 , 我 们 通过 at( ) 进行 数据 访问 的 范围 检查 , 并 且 我 们 捕获 out_of_range 以 避免 非 
法 的 数据 访问 。 

数据 访问 通常 的 做 法 是 ， 当 确定 元 素 索 引 是 有 效 的 时 , 我 们 通过 [ ] 使 用 下 标 操作 ; 而 当 元 素 
索引 可 能 造成 越界 时 , 我 们 应 使 用 函数 at( ) 进行 数据 访问 。 
19. 4. 1 附加 讨论 : 设计 上 的 考虑 

到 目前 为 止 , 我 们 的 实现 一 切 顺 利 , 但 为 什么 不 在 operator[ ] ( ) 中 实现 范围 检查 呢 ? 与 我 
们 的 实现 类 似 , 标准 库 vector 在 at( ) 中 提供 了 范围 检查 而 在 operator[ ] ( ) 中 没有 进行 范围 检 
查 。 在 本 节 中 , 我 们 将 解释 一 下 为 什么 要 这 样 做 。 之 所 以 这 么 做 主要 存在 以 下 4 个 方面 的 
观点 : 

1) 兼容 性 : 在 C++ 具有 有 异常 捕获 功能 之 前 ,人们 就 已 经 在 使 用 不 包含 范围 检查 的 下 标 操作 ， 

2) 效率 : 你 可 以 在 一 个 不 进行 范围 检查 但 性 能 更 优化 的 操作 符 基础 上 实现 一 个 进行 范围 检 
查 的 操作 符 , 但 你 不 能 在 一 个 进行 范围 检查 的 操作 符 基 础 上 实现 性 能 更 优化 的 操作 符 。 

3) 约束 : 在 一 些 环境 中 , 异常 是 不 可 接受 的 。 
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4) 检查 的 可 选 性 : C++ 标准 并 没有 规定 你 不 能 对 vector 进行 范围 检查 , 所 以 如 果 你 希望 进行 
检查 ,你 应 该 选择 能 够 进行 范围 检查 的 实现 。 

19. 4. 1.1 兼容 性 

人 们 总 是 希望 他 们 以 前 的 代码 能 够 正常 运行 。 例 如 ， 如 果 你 编写 了 一 百 万 行 的 代码 , 为 了 能 
在 这 些 代 码 中 正确 使 用 异常 而 重新 编写 这 些 代码 是 一 个 浩大 的 工程 。 我 们 可 能 会 认为 完善 这 些 
代码 是 有 意义 的 , 但 代码 的 拥有 者 却 不 会 这 么 想 。 而 且 , 已 有 代码 的 维护 人 员 会 认为 没有 进行 范 
围 检查 的 代码 可 能 是 不 安全 的 , 但 实际 上 他 们 的 代码 已 经 被 测试 以 及 使 用 了 铬 二 年 了 ,并且 所 有 
的 程序 销 误 都 已 经 被 发 现 了 。 我 们 可 以 怀疑 这 一 观点 ; 但 没有 人 能 够 那么 自信 。 在 标准 库 vector 
没有 锌 引入 C++ 标准 之 前 , 很 多 代码 都 使 用 不 包含 异常 处 理 的 vector 类 型 ( 非 标准 ) , 而 在 这 些 代 
码 中 , 大 部 分 的 代码 最 终 都 被 修改 以 使 用 标准 的 vector 类 型 。 

19. 4. 1.2 效率 

在 极 凯 情况 下 ,范围 检查 是 一 种 负担 , 例如 网 络 接口 的 缓冲 区 、 高 性 能 科学 计算 的 矩阵 。 
管 如 此 , 在 “普通 计算 "中 , 范围 检查 的 代价 并 不 是 什么 重要 话题 。 因 此 , 我 们 建议 应 该 尽量 a 
用 包含 范围 检查 的 实现 。 

19.4.1.3 约束 

对 于 一 些 程序 员 和 程序 而 言 , 这 一 观点 是 成 立 的 。 实 际 上 , 这 一 观点 对 很 多 的 程序 员 而 言 是 
成 立 的 , 并 且 不 应 被 忽略 。 尽 管 如 此 ,如 果 你 在 一 个 不 涉及 硬 实时 要 求 (参见 25.2. 1 节 ) 的 环境 
中 编写 程序 , 那么 你 应 该 选择 能 够 处 理 异常 以 及 范围 检查 的 vector 类 型 。 

19.4.1.4 检查 的 可 选 性 

ISO C++ 标 准 仅仅 指出 , 它 并 不 保证 vector 类 型 的 数据 越界 访问 具有 任何 特定 的 语义 , 且 应 
尽量 避免 这 类 访问 。 当 程序 试图 进行 越界 访问 时 , 抛 出 异常 这 一 操作 实际 上 是 遵循 C++ 标准 的 
操作 。 因 此 ,如 果 你 在 应 用 中 希望 vector 能 够 抛 出 异常 , 并 且 不 关心 前 面 三 个 观点 , 那么 你 应 该 
使 用 包含 范围 检查 的 vector 实现 。 这 正 是 我 们 在 这 本 书 中 所 做 的 。 

概括 起 来 说 就 是 , 现实 中 的 程序 设计 要 比 我 们 所 和 希望 的 更 加 复杂 混乱 , 但 总 会 存在 解决 问题 
的 办 法 。 
19. 4.2 使 用 安 

与 vector 类 似 , 大 多 数 标准 库 的 vector 类 型 不 对 下 标 操作 符 ([ ] ) 进行 范围 检查 , 但 在 at( ) 中 
提供 范围 检查 。 那 么 , 你 可 能 会 奇怪 , 程序 中 的 std :: out_of_range 异常 是 从 何 而 来 呢 ? 本质 上 , 我 
们 选择 了 19. 4. 1 节 中 的 “观点 4”: vector 的 实现 并 不 一 定 需 要 对 [ ] 进行 范围 检查 , 但 这 么 做 也 是 
可 以 的 , 因此 我 们 实现 了 这 一 检查 。 你 之 前 使 用 的 可 能 是 vector 的 调试 版 本 Vector, 而 这 一 版 本 
对 [ ] 进 行 了 范围 检查 。 这 一 版 本 是 我 们 开发 代码 过 程 中 采用 的 版 本 。 虽 然 这 一 版 本 会 牺牲 小 部 
分 程序 性 能 , 但 它 有 助 于 减少 程序 错误 和 调试 时 间 : z 

ee : out_of_range { /enhanced vector range error reporting 


Range. error(int i) :out_of_range("Range error"), index(i) { } 


}; 


template<class T> struct Vector : pubjlic std: :vector<T> { 
typedef typename std: :vector<T>::size_type size_type; 


Vector0 {} 
explicit Vector(size_type n) :std::vector<T>(n) {} 
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Vector(size_type n, const T& v) :std::vector<T>(n,v) 0 
T& operator[](unsigned int i) // rather than return at(i); 


if (i<Olithis—>size()<=i) throw Range_error(i); 
return std: :vector<T>: :operator[](i); 


} 
const T& operatorl](unsigned int i) const 


if (i<0jjthis->size(0<=i) throw Range_error(i); 
return std: :vector<T>:;:operator[l](i); 
} 
}; 


通过 使 用 Range_error, 我 们 能 够 对 元 素 的 访问 索引 进行 调试 。typedef 引入 了 一 个 更 便利 的 别 
名 , 参见 20.5 节 。 

这 个 Vector 类 十 分 简单 ,但 它 在 调试 环境 中 却 是 十 分 有 用 的 。 男 一 种 方法 是 使 用 与 测试 标准 
尔 之 前 所 做 的 。 我 们 不 可 能 准确 地 知道 你 所 使 
用 的 编译 希 信 息 以 及 你 所 用 的 库 提供 的 功能 (可 能 会 超出 C++ 标准 所 要 求 的 功能 ) 。 

在 std_lib_facilities. h 中 ,我们 采用 了 一 种 技巧 ( 宏 蔡 代 ) 以 重新 定义 vector 使 之 代表 Vector: 


/ disgusting macro hack to get a range-checked vector: 
#define vector Vector 


这 意味 着 当 你 使 用 vector 时 , 编译 器 将 认为 是 使 用 Vector。 这 一 技巧 并 不 太 好 , 因为 你 所 看 见 的 
代码 与 编译 器 所 看 见 的 代码 并 不 相同 。 在 实际 的 编程 中 , 宏 是 产生 星 涩 难 懂 的 错误 的 一 个 重要 来 
源 (参见 27.8 节 和 附录 A. 17) 。 

我 们 同样 也 为 string 类 型 实现 了 数据 访问 的 范围 检查 。 

遗憾 的 是 , 并 不 存在 标准 、 简 明 的 方法 以 对 vector[ ] 的 范围 检查 进行 指导 。 尽 管 如 此 ,与 我 
们 的 实现 相 比 , 还 可 以 针对 vector( 和 string) 实现 更 简明 、 更 完整 的 范围 检查 。 然 而 , 这 通常 涉及 
更 换 标准 库 实现 、 调整 库 安 装 选 项 或 融合 标准 库 的 源 代码 。 这 些 选择 对 于 C++ 的 初学 者 而 言 是 
困难 的 一 一 我 们 在 第 2 章 中 就 使 用 了 string。 


19.5 资源 和 异常 


vector 能 够 抛 出 异常 , 并 且 我 们 建议 , 当 一 个 函数 不 能 按 要 求 执行 操作 时 , 它 应 该 以 抛 出 异常 
的 方式 向 其 调用 者 进行 报告 (参见 第 5 章 )。 现 在 , 是 介绍 如 何 处 理由 vector 操作 或 者 我 们 调用 的 
其 他 函数 抛 出 的 异常 的 时 候 了 。 一 种 幼稚 的 回答 是 一 一 “使 用 try 语句 块 捕获 异常 ,输出 一 条 出 错 
消息 并 结束 程序 的 运行 "一 一 这 一 方法 对 于 大 多 数 系统 而 言 过 于 简单 了 。 . 

编程 的 一 个 基本 原则 是 , 如 果 我 们 获取 了 资源 ， 0 i ei es 
还 给 负责 管理 这 些 资源 的 系统 。 资 源 的 例子 包括 : 

。 内 存 

。 钾 

。 文件 句柄 

。 线程 句柄 

。 套 接 字 

e 窗口 

本 质 上 , 资源 可 以 视 为 这 样 的 一 类 东西 : 资源 的 使 用 者 必须 回 系统 中 的 资源 管理 者 ” 归还 




















pa 咱 
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(释放 ) 资 源 , 并 由 “资源 管理 者 "负责 资源 的 回收 。 最 简单 的 例子 就 是 目 由 空间 的 内 存 室 间 4 我们 
通过 new 获得 内 存 空 间 , 而 通过 delete 归还 内 存 空 间 。 例 如 : - 
void suspicious(int s, int x) 
int* p= new int[s]y /acquire memory 


1/ ，, ， 
delete[] p; 1 release memory 


正如 在 17.4.6 节 中 提 到 的 , 我 们 不 得 不 时 刻 提醒 自己 释放 内 存 , 但 这 通常 不 是 那么 容易 的 事 
情 。 当 我 们 学 习 异 常 处 理 时 , 资源 泄漏 问题 变 得 更 为 普遍 。 特 别 地 , 我 们 需要 小 心 处 理 那 些 显 式 
使 用 new 操作 并 将 所 得 指针 赋 给 局 部 变量 的 代码 , 如 suspicious( ) 。 
19. 5. 1 潜在 的 资源 管理 问题 

我 们 必须 小 心 处 理 表面 上 无 害 的 指针 赋值 操作 , 例如 

int* p= new int[sl; /acquire memory 
的 原因 是 , 在 代码 中 保证 每 一 个 new 操作 都 对 应 一 个 delete 操作 实际 上 是 很 困难 的 。 至 少 在 sus- 
picious( ) 函数 中 ,必须 存在 “delete[ ] p; "这样 的 语句 ; 这 样 的 语句 可 能 会 释放 内 存 资源 , 但 也 会 
存在 某 些 意外 使 得 内 存 的 释放 不 会 发 生 。 我 们 在 *…" 中 放 入 什么 代码 才能 造成 内 存 泄漏 呢 ? 我 
们 的 例子 应 该 能 为 你 带 来 一 些 局 示 并 引起 你 对 此 类 代码 的 警惕 。 这 些 例子 同时 还 会 使 你 体会 到 
替代 这 类 代码 的 简单 、 有 效 的 方式 。 

当 程序 运行 到 delete 语句 时 , p 可 能 已 经 不 再 指向 我 们 所 分 配 的 内 存 资源 : 


void suspicious(int s, int x) 


{ 
int* p= new int[s]l; //acquire memory 
ji... 
if (x) p = q; // make p point to another object 
Ms 
delete[] p; I/ release memory 
} 
上 述 例子 中 的 站 (x) 使 得 我 们 不 能 够 确定 p 的 取 值 是 否 已 经 改变 。 程 序 也 可 能 永远 都 不 能 到 达 de- 
lete 请 铅 : 
void suspicious(int s, int x) 
{ 
int* p=new intfs]; /acquire memory 
if (x) return， 
i 
delete[] p; /| release memory 
} 


程序 不 能 到 达 delete 语句 的 原因 也 许 是 程序 抛 出 了 一 个 异常 ， 


void suspicious(int s, int x) 
‘ 


int* p= new int[s]; //acquire memory 
vector<int> Vv; 

i 

if (x) p[x] = v.at(x); 

ll... 


delete[] p; I/ release memory 
} 


我 们 这 里 将 着 重 讨 论 上 面 的 这 个 例子 。 当 程序 员 初 次 遇见 这 一 问题 时 , 他 很 可 能 会 认为 这 是 
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te ne a 当 得 出 这 一 错误 的 判断 后 , 程序 员 很 可 能 会 通过 
现 异常 捕获 以 试图 解决 这 一 问题 : 


void suspicious(int s, int x) // messy code 
{ 


int* p=new int[s]; /acquire memory 


vector<int> v; 
ll... 
try { 
if (x) plx] = Vv.at(x); 
1.. 
} catch (.. ) { // catch every exception 
dejete[] p; / release memory 
throw; / re-throw the exception 
} 
1... 
deletel] p; / release memory 


} 


上 述 解 决 方法 会 带 来 一 些 额 外 的 代码 并 造成 资源 释放 代码 的 重复 (delete [ ] p; ), 换 句 话说 ， 
这 一 解决 方法 是 拙劣 的 ; 更 糟 的 是 ， 它 不 能 对 所 有 的 可 能 悄 沈 进行 合理 的 归纳 。 下 面 是 一 个 获取 
更 多 资源 的 例子 : 


void suspicious(vector<int>& int s) 
{ 
int* p = new int[s]; 
vector<int>v1; 
1... 
int* q = new int[s]; 
vector<double> v2; 
/a 
delete[] p; 
delete[] q; 
} 


注意 ,如果 new 操作 不 能 够 分 配 所 需 内 存 , 它 将 抛 出 标准 库 异 常 bad_alloc。 对 于 这 个 例子 ， 
try…catch 技术 也 可 以 用 于 解决 内 存 泄漏 C++ 问题, 但 在 代码 中 会 包含 多 个 try 语句 块 , 这 将 造成 
代码 的 重复 元 余 。 我 们 不 喜欢 重复 丑陋 的 代码 ,因为 “重复 ”意味 着 代码 的 维护 代价 的 增加 , 而 

“丑陋 ”意味 着 代码 难于 修改 、 难 于 阅读 , 这 同样 增加 了 代码 维护 的 代价 。 
试 一 试 ” 在 上 面 的 例子 中 添加 try 语句 块 ， 以 保证 在 产生 异常 的 所 有 可 能 的 情况 下 ， 

资源 都 能 被 正确 地 释放 。 
19. 5.2 资源 获取 即 初始 化 

幸运 的 是 ,我们 可 以 不 必 在 代码 中 添加 复杂 的 ty…catch 语句 就 能 有 效 处 理 潜在 的 资源 泄漏 
问题 。 例 如 : 


void f(vector<int>& v, int S) 
{ 
vector<int> p(s); 
vector<int> q(s); 
1. 
} 


这 一 实现 就 好 得 多 了 。 资源 (在 这 里 是 自由 存储 区 中 的 内 存 空间 ) 由 构 千 本数 获取 ， 而 由 对 应 的 析 
构 函 数 释放 。 
” 当 我 们 解决 了 向 量 的 内 存 泄漏 问题 之 后 , 实际 上 已 经 解决 了 这 类 特别 的 “异常 问题 "。 这 一 解 
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决 方法 具有 通用 性 , 它 能 用 于 所 有 资源 类 型 : 通过 对 象 的 构造 函数 获取 资源 , 并 通过 对 应 的 析 构 
组 数 释放 资源 。 通 过 这 一 方法 能 够 有 效 处 理 的 资源 包括 : 数据 库 锁 、 套 接 字 和 IO 缓冲 区 。 这 一 
技术 有 一 个 折 口 的 名 字 “ 资 源 获 取 即 初始 化 ”, 简写 为 RAH。 

再 回 到 上 面 的 例子 。 不 论 我 们 采用 哪 种 方式 退出 函数 f()、 Pp 和 9q 的 析 构 函数 都 将 被 正常 调 
用 : 因为 bp 和 q 不 是 指针 , 我 们 不 能 对 它们 赋值 ，retum 语句 和 异常 的 抛 出 均 不 会 妨碍 析 构 函数 的 
执行 。 当 程序 的 执行 序列 超出 了 被 完全 构造 的 对 象 或 子 对 象 的 作用 域 时 , 这 些 对 象 的 析 构 函数 将 
自动 被 调用 。 当 一 个 对 象 的 构造 函数 执行 完毕 时 , 才 可 以 认为 它 被 构造 成 功 。 探 寻 这 两 句 话 的 详 
细 含 义 是 一 件 让 人 头疼 的 事情 , 但 它们 的 基本 含义 是 对 象 的 构造 函数 和 析 构 函数 会 根据 实际 需要 
饥 昱 用 。 z 

特别 地 ， 当 需要 在 某 一 范围 内 使 用 可 变 大 小 的 存储 空间 时 , 我 们 应 使 用 vector 而 不 是 显 式 使 
用 new 和 delete 。 z : 
19. 5.3 保证 

当 我 们 不 能 只 在 单一 的 作用 域 ( 及 其 子 作 用 域 ) 内 使 用 vector 对 和 象 时 , 我 们 应 该 怎么 做 呢 ? 
例如 : 


vector<int>* make el) / make a filled vector 
{ 
vector<int>* p = new vector<int>; //we allocate on free store 
1 ... fill the vector with data; this may throw an exteptons 
return p; 
} | 
这 个 例子 具有 普遍 意义 : 我 们 调用 一 个 函数 构造 一 个 复杂 的 数据 结构 ,并 将 该 结构 作为 结 采 返 
回 。 问 题 是 , 如 果 在 “填充 ”vector 对 象 时 发 生 了 异常 , 那么 make_vec( ) 将 会 造成 vector 对 象 所 占 
内 存 空间 的 泄漏 。 一 个 不 相关 的 问题 是 , 如 果 该 函数 成 功 了 ,那么 我 们 不 得 不 通过 delete 销毁 由 
make_vec( ) 返 回 的 对 象 (参见 17.4.6 节 )。 


我 们 可 以 通过 try 语句 块 处 理 异 常 的 抛 出 : 
vector<int>* make_vec() /make a filled vector 


{ 


vector<int>* p = new 0 // we allocate on free store 


try { 
/fill the vector with data; this may throw an exception 
return p; 
} 
catch (...) { 
delete p; /do our local cleanup 
throw; // re-throw to allow our caller to deal with the et 


// that some_function() couldn’t do what was 
// required of it 
} 
} 


make_vec( ) 函数 展示 了 错误 处 理 的 一 个 十 分 通用 的 形式 : 函数 总 是 试图 完成 它 的 工作 , 而 如 果 它 
不 能 完成 工作 , 则 它 应 释放 所 有 的 局 部 资源 (在 这 里 是 自由 存储 区 中 分 配 的 vector 对 象 ) 并 通过 抛 
出 异常 的 方式 报告 其 工作 的 失败 。 在 这 里 , 异常 是 由 一 些 其 他 的 函数 产生 并 抛 出 的 (vector:: 
at( ) ) ; make_vec( ) 只 是 通过 throw 直接 将 该 异常 重新 抛 出 | 这 是 一 种 简单 而 有 效 的 处 理 错误 的 广 
法 , 并 且 能 够 被 系统 地 使 用 : 

。 基 本 保证 : 代码 try…catch 的 目的 是 保证 make _vec( ) 要 么 成 功 ， 要 么 在 不 造成 资源 泄漏 的 
前 提 下 抛 出 异常 ,这 通常 称 为 基本 保证 。 如 果 程 序 中 的 某 段 代码 需要 能 够 从 异常 throw 中 
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恢复 , 那么 该 段 代码 就 需要 提供 基本 保证 。 所 有 的 标准 库 代 码 均 提供 了 基本 保证 。 
e。 强 保证 : 如 果 一 个 函数 除了 提供 基本 保证 , 还 具有 如 下 特征 : 在 该 隆 数 的 任务 失败 后 ， 所 
有 可 观测 值 ( 所 有 不 属于 该 函数 的 值 ) 的 到 值 仍 能 与 其 在 该 函数 被 调用 前 的 取 值 一 致 ， 那 
么 称 该 函数 提供 强 保证 。 强 保证 是 一 种 理想 情况 : 函数 要 么 成 功 完 成 了 所 有 的 任务 , 要 么 
除了 抛 出 异常 之 外 什么 也 不 做 。 
e 无 抛 出 保证 : 除非 我 们 进行 的 操作 十 分 简单 以 至 该 操作 不 会 产生 任何 失败 和 异常 的 抛 出 ， 
否则 我 们 很 可 能 不 能 实现 同时 满足 基本 保证 和 强 保证 的 代码 。 幸 运 的 是 ，C ++ 提供 的 所 
有 内 建 工 具 本 质 上 能 够 提供 无 抛 出 保证 : 它们 不 会 抛 出 异常 。 为 了 避免 异常 的 抛 出 ,我们 
应 该 避免 使 用 throw 、new 以 及 引用 类 型 的 dynamic_cast( 参见 附录 A. 5.7)。 
基本 保证 和 强 保 证 对 于 检验 程序 的 正确 性 是 十 分 有 用 的 。 为 了 能 够 根据 这 些 理想 情况 编写 
高 性 能 的 代码 ，RAI 是 必 不 可 少 的 。 有 兴趣 的 读者 可 以 阅读 4The C ++ Programming Language)》 一 
书 的 附录 卫 。 
我 们 应 该 总 是 避免 执行 未 定义 的 操作 (通常 它们 是 有 害 的 ) , 例如 对 0 进行 解 引 用 、 以 0 为 除 
数 、 对 数组 越界 访问 。 捕 获 异 常 并 不 能 保证 你 不 违反 这 些 基本 的 语言 规则 。 
19.5.4 auto_ptr 
在 出 现 异 常 的 情况 下 ，make_vec( ) 遵守 了 资源 管理 的 基本 原则 。 它 提供 了 基本 保证 一 一 所 有 
实现 良好 的 函数 都 应 该 提供 基本 保证 。 该 函数 还 提供 了 强 保 证 ,除非 该 函数 在 “向 vector 填充 数 
据 " 这 部 分 代码 中 对 非 局 部 数据 进行 了 操作 。 尽 管 如 此 ,try…catch 这 部 分 代码 仍然 是 丑陋 的 。 解 
决 方法 是 : 我 们 必须 使 用 RAII; 也 就 是 说 ， 我 们 需要 提供 一 个 对 象 以 容纳 vector < int > 对 象 , 以 使 得 
当 异 常 发 生 时 它 能 够 销毁 vector 对 象 。 为 实现 这 一 目标 ， 在 < memory > 中 标准 库 提供 了 auto_ptr: 


vector<int>* make_vec()  // make a filed vector 

{ 
auto_ptr< vector<int> > p(new vector<int>); /allocate on free store 
/ fill the vector with data; this may throw an exception 
return p.release(); /return the pointer held byp 


} 
auto_ptr 对 象 是 一 个 能 够 在 孔 数 中 存储 指针 的 对 象 。 我 们 通过 new 返 回 的 对 象 初始 化 auto_ptr 对 


象 。 与 指针 类 似 , 我 们 可 以 对 auto_ptr 使 用 -> 和 * 操作 符 (例如 p -> at(2) 或 (*p).at(2) ) ,因此 
我 们 可 以 认为 auto_ptr 是 一 类 指针 。 然 而 , 我 们 不 应 该 在 阅读 有 关 auto_ptr 的 文档 前 对 auto_ptr 执 
行 拷贝 操作 ; auto_ptr 的 语义 与 我 们 之 前 遇见 的 类 型 不 同 。release( ) 操作 使 auto_ptr 返回 普通 的 指 
针 , 以 使 得 我 们 能 够 将 其 作为 函数 返回 值 ， 并 且 使 得 auto_ptr 在 函数 返回 时 不 销毁 它 指 向 的 对 象 。 
我 们 不 应 采用 其 他 方式 ( 例如 拷贝 ) 使 用 auto_ptr。auto_ptr 的 用 途 是 存储 指针 并 保证 在 指针 所 指 
向 对 象 的 作用 域 结 束 时 销毁 该 对 象 ，auto_ptr 的 其 他 用 途 需 要 你 掌握 一 些 相 当 专 业 的 知识 。auto_ 
ptr 是 保证 诸如 make_vec( ) 之 类 代码 的 简单 性 和 高 效 性 的 一 种 特殊 的 工具 。 特 别 地 ，auto_ptr 使 得 
我 们 能 够 继续 保持 对 显 式 try 语句 块 的 警惕 ; 大 多 数 的 .try 语句 块 能 够 被 “ 资源 获取 即 初始 化 ”技术 
取代 。 
19. 5.5 vector 类 的 RAN 

像 auto_ptr 这 样 带 有 一 点 智能 的 指针 看 上 去 有 点 特别 。 如 何 保证 我 们 已 经 发 现 了 所 有 需要 保 
护 的 指针 ?如 何 保 证 我 们 已 经 释放 了 所 有 指针 指向 的 所 有 对 象 ? 回 到 19..3.6 节 中 的 reserve( ) 
例子 : 
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template<class T, class A> 
void vector<T,A>: :reservelint newalloc) 


{ | I 
if (newalloc<=space) return; ~ // never decrease allocation 
T*p=alloc.allocate(newalloc); /allocate new space - 
for (int i=0; i<sz;.++i) alloc.construct(&pfi],elem[i}); . /copy 
for (int i=0; i<sz; ++i) alloc.destroy(&elem[{i]); 1 destroy 
alloc.deallocate(elem,space); // deallocate old space 
elem = p; 
space = newalloc; 

} 


注意 , 对 已 有 元 素 的 拷贝 操作 alloc. construct( &p[i] , elem[i] ) 可 能 会 抛 出 异常 。 因 此 ， p 是 
我 们 在 19. 5. 1 节 中 所 描述 问题 的 一 个 例子 。 我 们 可 以 采用 auto_ptr 解决 方案 。 一 个 更 好 的 解决 
方案 是 , 将 “ 回 量 所 占 内 存 ” 认 为 是 一 种 资源 ; 也 就 是 说 , 我 们 可 以 定义 一 个 vector_base 类 以 代表 
我 们 之 前 使 用 过 的 基本 概念 。 下 图 显示 了 回 量 对 象 中 用 于 定义 内 存 使 用 的 三 个 成 员 : : 
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vector_base 的 代码 (为 保持 完整 性 而 加 和 人 了 分 配器 ) 的 形式 为 : 


template<class T, class A> 
struct vector_base { 
A alloc; / allocator | 
T* elem; // start of allocation 
int sz; // number of elements 
int space; /amount of allocated space 


vector_base(const A& a, int n) 

: alloc(a), elem(a.allocate(n)), sz(n), space(n) { } 
~vector_base() { alloc.deallocate(elem,space); } 
}; | 


注意 ,vector_base 处 理 的 是 内 存 而 不 是 ( 类型) 对象。 我 们 的 vector 实现 可 以 将 它 用 于 存储 所 
需要 元 素 类 型 的 对 象 。 本 质 上 ，vector 是 vector_base 的 一 个 便捷 的 接口 


template<class T, class A = allocator<T> > 
class vector : private vector_base<T,A> { 
pubiic: 

1.. 
}; 


我 们 可 以 按 如 下 方式 重新 实现 reserve( ) : 


template<class T, class A> 

void vector<T,A>::reservelint newalloc) 

{ 
if (newalloc<=this-> space) return; // never decrease allocation _ 
vector_base<T,A> b(this—> alloc,newalloc); // ailocate new space 
for (int i=0; i< this—> sz; ++i) this—-> alloc.construct(&b.eleml[i], 

this->elemli]);  // copy 
for (int i=0; i< this-~>sz; ++i) this—> alloc.destroy(& this-> eleml[i]); 
// destroy old 
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< 了 T, A> 的 成 员 ( 如 vector_base <T, A> :: 


swap< vector_base<T,A> >(*this,b);  // swap representations 
} 


必须 显 式 使 用 this ->。 


试 一 试 通过 使 用 auto_ptr 修改 reserve 函数 。 记 住 在 返回 前 调用 release( ) 函数 。 将 


这 种 方法 与 vector_base 方法 相 比 较 ， 看 看 哪 种 方法 更 容易 正确 地 实现 。 


到) 简单 练习 


‘DO 0 -7 OO 人 


je 
入 ND 一 OO 


. 定义 template <class T> struct ST val;};。- 
. 添加 构造 函数 , 使 得 能 够 对 TT 初始化。 

. 定义 S<int>、S<char>、S<double >、S<string> 和 S<vector < int >> 类 型 的 变量 , 并 将 其 初始 化 。 
. 读 取 并 打印 上 述 变量 的 值 。 

.添加 函数 get( ) , 该 函数 返回 对 val 的 引用 。 

. 在 类 之 外 编号 get( ) 的 定义 。 

. 将 val 设 为 私有 成 员 。 

. 用 get( ) 晒 数 完成 练习 4 中 的 任务 。 

.添加 函数 模板 set( ) 以 能 够 改变 val。 

. 用 operator[ ]( ) 取代 get( ) 和 set( ) 。 

， 编写 operator| ] ( ) 的 const 版 本 和 非 const 版 本 。 

.定义 孙 数 template < class T > read_val(T&v), 该 函数 能 够 将 cin 中 读 取 的 值 写 人 v。 
. 通过 read_val( ) 设置 练习 3 中 前 4 个 变量 的 值 。 

. 定义 template < class T > istream &operator >> (istream 久 , vector <T> 色 ) 以 使 read a ) 能 够 处 理 


S <vector < int >> 变量 。 


记 住 在 每 一 步 中 对 代码 进行 测试 。 


到》 思考 题 


OOD 


.为 什么 需要 调整 vector 对 象 的 大 小 ? 

.为 什么 需要 使 用 具有 不 同 元 素 类 型 的 vector 对 象 ? 

. 为 什么 不 在 所 有 可 能 的 情况 中 定义 一 个 具有 足够 大 规模 的 vector 对 象 ? 
.需要 为 一 个 新 的 vector 对 象 分 配 多 少 空闲 内 存 空间 ? \ 

， 何 时 必须 将 vector 对 象 包含 的 元 素 拷贝 至 新 的 内 存 空间 ? 


在 一 个 vector 对 象 构造 成 功 之 后 , 哪些 vector 操作 能 够 改变 它 的 大 小 ? 


. 拷贝 结束 后 ,vector 对 象 的 取 值 如 何 ? 

. 哪 两 个 操作 定义 了 vector 的 拷贝 ? 

. 对 于 类 的 对 象 而 言 , 拷贝 的 默认 含义 是 什么 ? 

. 什么 是 模板 ? 

. 最 有 用 的 两 种 模板 参数 类 型 是 什么 ? 

. 什么 是 泛 型 编程 ? 

. 泛 型 编程 与 面向 对 象 的 编程 之 间 有 什么 区 别 ? 
.array 与 vector 有 什么 区 别 ? 

.array 与 内 置 数 组 有 什么 区 别 ? 


当 我 们 退出 reserve( ) 函数 时 ,, 原 有 内 存 空间 将 被 vector_base 的 析 构 函数 自动 释放 一 一 即使 退 
出 是 由 拷贝 操作 所 产生 的 异常 造成 的 。swap( ) 函数 是 一 个 标准 库 算 法 (在 < algorithm > 中), 它 


够 交换 两 个 对 象 的 取 值 。 我 们 使 用 swap < vector_based <T, A >> (“this, b) 而 不 是 swap( "this, b) ， 


因为 “this 和 b 是 两 种 不 同 的 类 型 ( vector 和 vector_base)。 类 似 地 ， 当 我 们 从 派生 类 vector 
reserve( ) ) 中 引用 基 类 vector_base <T, A > 的 成 员 时 ， 
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16.，resize( ) 和 reserve( ) 有 什么 区 别 ? 
17. 什么 是 资源 ? 给 出 它 的 定义 并 举例 说 明 。 
18. 什么 是 资源 泄漏 ? 
19. 什么 是 RAII? 它 能 解决 什么 问题 ? 
20，auto_ptr 的 用 途 是 什么 ? 
全 术语 
#define 宏 特例 化 at( ) 
push_back( ) 强 保 证 auto_ptr RAT 
模板 基本 保证 resize( ) 模板 参数 
异常 资源 this 保证 
重 抛 出 hi 实例 化 自我 赋值 
<》 习 是 
针对 每 一 习题 , 通过 已 定义 类 的 对 象 测试 你 的 设计 和 实现 确实 达到 了 预期 要 求 。 在 涉及 异常 的 地 方 , 需要 
认真 考虑 错误 产生 的 来 源 。 


下 


8. 


9. 


10. 


11， 


13. 


编写 一 个 模板 函数 f( ), 该 函数 能 够 实现 将 一 个 vector <T > 中 的 元 素 加 到 另 一 个 vector <T > 中 的 元 素 ， 
例如 , f(v1, 他) 应 对 vl 的 每 个 元 素 计 算 vi[i] + =vw2[i]。 


.编写 一 个 模板 函数 , 该 函数 以 vector <T > vt 和 vector <U > vu 为 参数 并 返回 所 有 wt[i] * vu[ 让 之 和 。 
， 编 写 一 个 模板 类 Pair, 该 类 能 够 存储 任何 类 型 的 值 对 。 使 用 该 类 实现 一 个 类 似 于 我 们 在 计算 器 中 所 使 用 


的 符号 表 ( 参 见 7.8 节 )。 


. 将 17.9.3 节 中 的 Link 类 实现 为 模板 , 该 模板 以 数值 类 型 作为 模板 参数 。 然 后 使 用 Link < God > 完成 第 17 


章 的 习题 13。 


.定义 mt 类 , 该 类 包含 一 个 int 类 的 成 员 。 定 义 该 类 的 构造 函数 、 赋值 和 + 、- 、* 、/ 操 作 符 。 测 试 该 类 


并 根据 需要 对 它 进行 完善 (例如 , 定义 << 和 >> 操作 符 )。 


. 使 用 Number <T > 类 重新 完成 上 面 的 习题 , 其 中 T 可 以 是 任何 数值 类 型 。 为 Number 实现 % 操 作 符 并 观察 


对 Number < double > 和 Number < int > 进行 % 运 算 的 结果 。 


.通过 Number 完成 习题 2。 


通过 基本 函数 malloc( ) 和 free( )( 见 附录 B10.4) 实 现 一 个 分 配器 (参见 19. 3.6 节 )。 通 过 见 19.4 节 结 束 
时 定义 的 vector 类 型 测试 该 分 配器 。 
通过 使 用 分 配器 (参见 19. 3.6 节 ) 重 新 实现 vector:: operator = ( ) (参见 19. 2.5 节 )。 


实现 一 个 简单 的 auto_ptr, 实现 其 构造 函数 、 析 构 函 数 、-> 、 和 release( ) 。 特 别 地 , 不 要 实现 其 赋值 或 
拷贝 构造 函数 。 

设计 并 实现 counted_ptr <T > 类 型 , 该 类 型 存储 两 个 对 象 ; 一 个 指向 T 类 型 对 象 的 指针 ; 一 个 指向 代表 该 
T 对 象 “ 使 用 计数 "的 整 型 数 的 指针 , 该 整 型 数 被 所 有 指向 该 了 对 象 的 计数 指针 (counted_ptr) 所 共享 。 对 
于 一 个 确定 的 了 对象,“ 使 用 计数 "的 取 值 代表 了 指向 该 对 象 的 所 有 计数 指针 的 总 数 。counted_ptr 的 构 
造 函 数 在 自由 存储 区 中 为 了 对象 和 其 "使 用 计数 " 分配 内 存 空间 。 为 counted_ptr 的 了 设 定 一 个 初始 值 。 
当 最 后 一 个 指向 了 对 和 象 的 counted_ptr 被 销毁 时 ，counted_ptr 的 析 构 函数 应 负责 销毁 T 对 象 。 实 现 coun- 
ted_ptr 类 型 的 相关 操作 ， 以 使 我 们 能 够 与 使 用 指针 相同 的 方式 使 用 counted_ptr 类 型 的 对 象 。 这 一 习题 
是 “智能 指针 ”的 一 个 例子 , 它 能 够 保证 一 个 对 象 的 存在 , 直至 该 对 象 的 最 后 一 个 使 用 者 停止 使 用 该 对 
象 。 编 写 测试 counted_ptr 的 方案 , 并 在 方案 中 将 counted_ptr 作为 调用 的 参数 ， 如 作为 容器 的 元 素 ， 
等 等 。 


:定义 File_handle 类 , 该 类 的 构造 函数 以 一 个 字符 串 ( 文件 名 ) 作 为 参数 , 并且 该 类 在 构造 函数 中 打开 文 


件 ,而 在 析 构 函数 中 关闭 文件 。 
编写 Tracer 类 , 且 该 类 的 构造 函数 和 析 构 函数 均 会 打印 一 个 字符 串 , 其 中 待 打印 字符 串 以 构造 函数 参数 
的 形式 进行 传递 。 通 过 Tracer 类 观察 RAII 管理 对 象 会 在 代码 中 的 什么 位 置 完 成 它们 的 任务 ( 即 通过 
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Tracer 观察 局 部 对 象 、 成 员 对 象 、 全 局 对 象 由 new 分 配 的 对 象 ,等 等 ) 。 然 后 , 为 Tracer 类 添加 拷贝 构造 
函数 和 拷贝 赋值 函数 , 并 通过 Tracer 对 象 观察 拷贝 是 在 何 时 进行 的 。 

14. 为 第 18 章 习 题 中 的 “ 猜 杀 怪兽 "游戏 实现 GUI( 用 户 图 形 界 面 ) 接 口 和 图 像 输出 功能 。 程 序 从 输入 框 中 获 
得 输入 信息 , 并 在 一 个 窗口 中 显示 当前 玩家 已 知 的 山洞 部 分 。 

15. 修改 上 一 习题 的 程序 ， 以 使 用 户 能 够 在 他 当前 所 获得 的 信息 和 猜测 的 基础 上 标识 房间 , 例如 “可 能 有 蝙 
蝠 "和 ”无 底 陷 阱 ”。 

16. 在 有 些 场 合 中 ,人 们 希望 一 个 空 的 vector 对 象 所 占用 的 内 存 空间 尽 可 能 地 小 。 例 如 , 我 们 可 能 需要 大 量 
使 用 vector < vector < vector < int >>> 类 型 ， 且 大 部 分 的 向 量 均 是 空 向 量 。 定 义 一 个 vector, 使 得 sizeof 


(vector <int > ) ==sizeof( int* ) ， 即 vector 只 包含 一 个 指针 , 且 该 指针 指向 一 个 由 元 素 、 元 素数 量 值 、 

space 指针 组 成 的 结构 。 
》 附 言 

模板 和 异常 是 十 分 强大 的 语言 特征 。 它 们 为 编程 技术 带 来 了 相当 的 灵活 性 一 一 主要 通过 帮助 人 们 分 离 
关注 点 的 方式 , 也 就 是 说 , 一 次 只 处 理 一 个 问题 。 例 如 , 通过 使 用 模板 , 我 们 可 以 在 不 关注 元 素 类 型 的 情况 
下 设计 一 个 容器 , 例如 vector。 类 似 地 , 通过 使 用 异常 ,我 们 能 够 将 用 于 检测 和 报告 错误 的 代码 和 处 理 该 错 
误 的 代码 相 分 离 。 本 章 的 第 三 个 主题 , 改变 vector 的 大 小 , 也 体现 了 这 一 灵活 性 : push_back( ) 、resize( ) 和 
reserve( ) 使 我 们 能 够 将 vector 的 实现 与 vector 的 大 小 规格 相 分 离 。 
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“只 做 一 件 事 ,并 把 它 做 好 。 多 个 程序 协同 工作 。 





Doug Mcllory 


本 章 和 第 21 章 将 分 别 介 绍 C++ 标准 库 (STL) 中 的 容器 和 算法 部 分 。STL 是 一 个 用 于 处 理 
C++ 程序 中 的 数据 可 扩展 框架 。 我 们 首先 通过 一 个 简单 的 例子 来 说 明 STL 的 设计 理念 和 基本 概 
念 。 我 们 会 详细 讨论 迭代 器 、 链 表 和 STL 中 的 容器 。STL 通过 序列 (sequence ) 和 迭代 器 (iterator) 
的 概念 将 容器 (数据 ) 和 算法 (数据 处 理 方法 ) 关联 起 来 。 本 章 的 内 容 为 第 21 章 介绍 通用 和 高 效 的 
算法 葛 定 了 基础 。 作 为 示例 , 本 章 实现 了 一 个 文字 处 理 程序 的 基本 框架 。 


20. 1 存储 和 处 理 数 据 


在 处 理 数据 量 很 大 的 问题 之 前 , 我 们 先 来 看 一 个 简单 的 例子 , 它 说 明了 解决 一 般 数 据 处 理 问 
题 的 基本 方法 。jJack 和 J 记分 别 负 责 测量 过 往 车 辆 的 速度 , 结果 用 浮 点 数 来 表示 。Jack 是 一 名 C 
语言 程序 员 , 所 以 将 测量 值 保存 到 一 个 数组 中 , 而 Ji 将 测量 值 保 存 到 有 关 vector 对 象 中 。 如 果 我 
们 要 在 程序 中 使 用 他 们 的 数据 , 该 如 何 操作 呢 ? 

我 们 可 以 将 Jack 和 Jil 程序 的 结果 分 别 瑟 到 某 个 文件 中 , 然后 再 从 文件 中 读 和 数据。 使 用 这 
种 方法 , 我 们 的 程序 将 与 Jack 和 Jill 所 选用 的 数据 结构 和 接口 彻底 无 关 。 通 常 , 这 种 程序 之 间 的 
独立 性 是 一 种 很 好 的 特性 ,此 时 我 们 可 以 采用 第 10 和 11 章 中 介绍 的 方法 来 获得 输入 数据 ， 并 利 
用 vector < double > 对 象 来 进行 计算 。 

但 是 ,如 果 我 们 的 任务 不 适合 使 用 文件 呢 ? 假设 , 我 们 必须 每 秒 钟 调用 一 次 数据 生成 函数 
来 获得 一 组 新 的 数据 。 例 如 ,下面 的 程序 每 秒 都 会 调用 Jack 和 Jill 的 函数 来 获得 将 要 处 理 的 
数据 : 


double" get_from_jack(int* count); //Jack puts doubles into an array and 
// returns the number of elements in *count 
vector<double>"* get from jill0; WJill fills the vector 


void fct() 
{ 
int jack_count = 0; 
double* jack_data = get_from_jack(&jack_count); 
vector<doubie>* jilL data = get_from_jillg， 
1/ . . .process . . . 
delete[] jack_data; 
delete jill_data; 
} s 


上 面 这 段 代 码 假设 我 们 要 自己 安排 存储 数据 的 空间 ,而 且 在 用 完 这 些 数据 之 后 要 自己 负责 删除 工 
作 。 另 一 个 假设 是 我 们 不 能 重 写 Jack 和 了 Jill 的 代码 , 而 且 通 常 我 们 也 不 想 这 样 做 。 
20. 1.1 处 理 数 据 

显然 , 这 个 例子 过 于 简单 ,但 是 它 与 很 多 实际 问题 并 没有 本 质 区 别 。 如 果 我 们 能 够 很 好 地 解 
决 这 个 例子 , 就 能 够 处 理 一 大 类 通用 的 编程 问题 。 问 题 的 关键 在 于 ,我 们 无 法 控制 提供 数据 的 程 
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序 以 什么 形式 来 提供 数据 。 我 们 可 以 自由 决定 是 没 用 原 有 的 数据 格式 ,还 是 转换 为 另 一 种 形式 来 
进行 存储 和 处 理 。 

我 们 需要 如 何 处 理 数据 ? 排序 ? 找 出 最 大 值 ? 找 出 平均 值 ? 找 出 大 于 65 的 值 ? 比较 Jal 和 
Jack 的 数据 ? 处 理 需求 多 种 多 样 , 我 们 只 能 根据 具体 任务 来 编写 处 理 程序 。 这 里 , 我 们 主要 是 学 
习 怎 样 处 理 数据 , 完成 大 量 数据 的 计算 。 首 先 从 简单 的 处 理 开 始 : 找到 数据 集合 中 的 最 大 值 。 我 


们 可 以 将 fet( ) 范 数 中 内 容 为 …process… ”的 注释 行 蔡 换 为 下 面 这 段 代码 : 
兴 
double h = -1; 
double* jack_high; /jack_high will pointto the element with the highest value 
double* jill_high; CW jill_high will point to the element with the highest value 


for (int i=0; i<jack_count; ++i) 
if (h< jack_datali]) { 
jack_high = &jack_data [i]l; // save address of largest element 
h = jack_data [i]; //update "largest element" 


h = -1; 
for (int i=0; i< jill_data -~>size(); ++i) 
if (h<(*jill_data)[il){ 
jilL_high = &(*jill_data)[i]; //save address of largest element 
h = (*jill_data)[i]; //update 'largest element’ 


cout << "Jill's max: " << *jill_high 
<< ) jack's max: " << *jack_high; 


1... 
注意 访问 J]ill 的 数据 时 使 用 的 方法 : ( “ji_data) [i] 。get_from_jil( ) 函数 返回 一 个 指向 vector 
对 象 的 指针 vector < double > ”。 为 了 获得 数据 内 容 , 我 们 首先 要 获得 vector 对 象 本 身 的 引用 :“jill 
_data, 然后 通过 索引 下 标 访问 其 中 的 元 素 。 然 而 ,， jij_data[ i] 并 不 是 我 们 想 要 的 结果 ,因为 运算 
符 [ ] 的 优先 级 要 高 于 运算 符 ”, 所 以 这 个 表达 式 的 含义 是 (jill_data[i] ), 必须 在 "jij_data 外 使 用 
括号 , 结果 为 : ("jill_data) [i]。 : 
试 一 试 ” 如 果 我 们 可 以 修改 Jil 的 代码 , 应 该 如 何 修 改 代 码 的 接口 来 避免 复杂 的 数 
据 访问 方法 ? 
20. 1.2 一 般 化 代码 
我 们 希望 使 用 统一 的 方法 来 访问 和 处 理 数据 , 这 样 可 以 避免 因为 每 次 获得 的 数据 格式 不 同 而 编 
写 不 同 的 处 理 代码 。 下 面 我 们 以 Jack 和 了 il 的 代码 为 例 , 讨论 如 何 让 我 们 的 代码 更 通用 、 更 统一 。 
显然 , 我 们 对 Jack 和 Jil 的 数据 的 处 理 方法 很 相似 。 但 是 处 理 代 码 有 两 个 不 同 之 处 : jack_ 
count 和 jill_data -> size( ) ; jack_data[ i] 和 ( “jill_data)[i] 。 我 们 可 以 通过 定义 下 面 的 引用 来 避免 


第 2 个 不 同 之 处 : 
vector<double>& v = *jill_data; 
for (int i=0; i<v.size(); ++i) 

if (h<vIil)t 
jil_high = &v[il; 
) h = v[il; 


这 段 代码 与 处 理 Jack 数据 的 代码 很 相似 。 接 下 来 如 何 编 写 一 个 可 以 同时 处 理 Jack 和 Ji 数据 的 函 
数 呢 ? 方法 有 很 多 (参考 练习 3) , 出 于 整体 一 致 性 的 考虑 (这 一 点 在 接 下 来 的 两 章 中 十 分 明显 ) ， 


我 们 选择 下 面 这 种 基于 指针 的 方法 : 


doubie* high(double* first, double* last) 
// return a pointer to the element in Ifirst, last) that has the highest value 


{ 
double h = -人 
double* high; 
for(double* p = first; p!=last; ++p) 
if (h<*p) {high = p; h =*p; } 
return high; 
} 


使 用 这 个 函数 , 数据 处 理 代码 可 以 改写 为 ; 


double* jack_high = high(jack_data,jack_data+jack_count); 
vector<double>& v = *jill_data; 
double* jill_high = high(&v[0],&vf0]+vsize()); 


这 段 代码 更 加 简洁 , 不 仅 省 去 了 很 多 变量 的 定义 , 并 且 只 出 现 了 一 段 循 环 代码 (在 high() 中 )。 如 
果 我 们 想 要 得 到 最 大 值 ， 只 需要 检查 ”jack_high 和 ”jil_high, 例如 : 


cout << "Jill's max: ”<< *jill_high 
<< ;jacks max: "<< *jack_high; 


注意 , high( ) 函数 要 求 所 处 理 的 数据 保存 在 一 个 数组 中 , 所 以 “ 找 出 最 大 值 ” 的 算法 返回 的 是 指 问 
数组 元 隶 的 指针 。 
试 一 试 ”这 段 程序 中 有 两 个 游 在 的 严重 错误 。 其 中 一 个 会 导致 程序 异常 ， 另 一 个 

会 导致 high( ) 函数 返回 错误 的 结果 。 下 面 将 要 介绍 的 一 般 化 技术 会 充分 暴露 出 这 两 

个 错误 ， 并 给 出 系统 的 避免 方法 。 现 在 我 们 只 需要 找 出 这 两 个 错误 ， 并 提出 修改 

意见 。 

high( ) 郴 数 的 局 限 性 在 于 只 能 处 理 某 个 特定 的 问题 : 

。 只 能 处 理 数 组 。vector 的 元 素 必 须 保 存在 数组 中 ， 但 实际 上 数据 的 存储 方式 还 有 可 能 是 

list 和 map( 人 参见 20.4 节 和 21.6.1 节 )。 


e 可 以 处 理 double 类 型 的 vector 或 数组 , 但 是 无 法 处 理 其 他 类 型 的 元 素 , 例如 vector < double > 
和 char[ 10 ] 。 

。 只 能 找 出 最 大 值 , 无 法 完成 其 他 简单 的 数据 计算 功能 。 

下 面 , 我 们 探讨 如 何在 更 通用 的 数据 集合 上 进行 计算 。 

通过 指针 的 方式 来 实现 “ 找 出 最 大 值 ” 的 算法 会 带 来 一 个 意 想不到 的 通用 性 : 我 们 不 仅 可 以 找 
出 整个 数组 或 vector 中 的 最 大 值 , 还 可 以 找 出 数组 或 vector 的 某 个 部 分 的 最 大 值 , 例如 : 

A v = *jilldata; 

doubie* middie = &v[0]+v.size()/2; 

double* hight = high(&v[01, middle); /max of first haif 


double* high2 = high(middle, &v[01+v.size0); /max of second half 
We 


这 里 highl 指 问 vecotr 中 前 半 部 分 的 最 大 值 ,high2 指 问 vecotr 中 后 半 部 分 的 最 大 值 。 下 面 是 这 个 


结果 的 图 形 表示 : 
&vI0]l Middle &v[0] + v.size() 
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high( ) 函数 的 参数 是 指针 , 这 有 些 偏 于 底层 , 更 容易 引起 错误 。 对 于 大 多 数 程序 员 来 说 , 找 
出 vector 中 最 大 值 的 代码 如 下 所 示 : 


double* find_highest(vector<double>& v) 
{ 
double h = -1; 
double* high = 0; 
for (int i=0; ij<v.size(); ++i) 
if (he<vIil) {high = &v[lil; h = v[il;} 
return high; 
} 


然而 , 这 段 代码 就 失去 了 high( ) 所 具有 的 灵活 性 : 我 们 不 能 用 find_highest( ) 来 找 出 vector 中 
某 一 部 分 的 最 大 值 。 我 们 只 是 为 了 同时 处 理 数 组 和 vector 才 决 定 使 用 指针 , 但 实际 上 却 意外 地 获 
得 了 某 种 灵活 性 。 我 们 应 该 记 住 : 一 般 化 处 理 可 以 获得 适用 于 多 个 问题 的 通用 函数 。 


20.2 STL 建议 


C++ 标准 库 为 处 理 数据 序列 提供 了 一 个 专门 的 框架 , 称 为 STL。STL 是 标准 模板 库 ( standard 
template library ) 的 简称 。STL 是 ISO C++ 标准 库 的 部 分 , 它 提供 了 容器 (例如 vector、list 和 map ) 
和 通用 算法 (例如 sort、find 和 accumulate) 。 因 此 我 们 可 以 称 vector 这 类 对 象 为 STL 或 标准 库 的 一 
部 分 。 标 准 库 的 其 他 部 分 , 例如 ostream( 见 第 10 章 ) 和 C 风格 的 字符 串 处 理 函 数 ( 见 附录 B. 10. 3 ) 
并 不 属于 STL。 为 了 更 好 地 理解 STL, 我 们 首先 考虑 在 处 理 数 据 时 必须 要 解决 的 问题 和 对 解决 方 
法 的 基本 要 求 。 

计算 过 程 包含 两 个 方面 : 计算 和 数据 。 有 时 候 我 们 只 关注 计算 方面 ,谈论 让 语句 、 循 环 、 函 
数 和 错误 处 理 等 。 有 时 我 们 关注 的 是 数据 , 包括 数组 、 向 量 、 字 符 串 和 文件 等 。 然 而 ,要 完成 真 
正 的 工作 我 们 需要 同时 考虑 计算 和 数据 。 如 果 不 经 过 分 析 、 可 视 化 和 查找 所 需 数据 等 处 理 , 大量 
数据 都 无 法 使 用 。 相 反 , 我 们 可 以 随心 所 欲 地 进行 计算 , 但 是 只 有 与 实际 数据 关联 之 后 , 才能 避 
免 没 有 意义 的 计算 过 程 。 而 且 ,“ 计 算 部 分 ”要 优雅 地 与 “数据 部 分 "进行 交互 。 





当 谈 起 数据 时 , 我 们 会 想到 很 多 类 型 的 数据 : 各 种 形状 、 数 以 百 计 的 温度 值 、 数 以 千 计 的 日 
志 记 录 、 数 以 百 万 计 的 指针 和 网 页 等 , 即 数据 的 容器 和 数据 流 。 特 别 地 , 我 们 并 不 是 要 讨论 如 何 
为 一 种 对 象 (例如 , 复数 、 温 度 值 和 圆 形 等 ) 选 择 最 恰当 的 数值 。 对 于 这 些 数 据 类 型 ， 可 以 参考 第 
9、11 和 14 章 。 

考虑 我 们 需要 对 “ 大量 数 据 " 进 行 的 一 些 简单 操作 : 

。 按照 字典 序 排序 。 

。 根据 姓名 在 电话 本 中 找到 对 应 的 电话 号 码 。 

。 找 出 温度 的 最 高 值 。 

。 找 出 所 有 大 于 8800 的 值 。 

。 找 出 第 一 个 值 为 17 的 元 素 。 

。 根据 单元 编号 对 遥测 记录 进行 排序 。 

。 根据 时 间 戳 对 遥测 记录 进行 排序 。 
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。 找 出 第 一 个 值 大 于 “Petersen 的 元 素 。 
。 找 出 最 大 值 。 
s 找 出 两 个 序列 的 第 一 个 不 同 之 处 。 
。 计算 两 个 序列 的 内 积 。 
。 找 出 一 个 月 中 每 天 的 最 高 气温 。 
® 在 销售 记录 中 找 出 最 畅销 的 10 件 商品 。 
e 统计 “Stroustrup” 在 网 页 中 出 现 的 次 数 。 
e 计算 各 个 元 素 之 和 。 
注意 , 我 们 在 讨论 上 述 数据 处 理 任 务 时 , 并 没有 提 到 数据 如 何 存储 。 很 显然 , 我 们 必须 要 在 
数据 处 理 过 程 中 用 到 列表 、 回 量 、 文 件 和 输入 流 等 内 容 , 但 是 我 们 不 必 了 解 这 些 数据 存储 的 细节 
就 可 以 完成 相应 的 处 理 任务 。 重 要 的 是 这 些 数 据 或 对 象 ( 或 元 素 ) 的 类 型 、 如 何 访问 这 些 数据 或 对 
象 以 及 要 对 它们 进行 哪 种 操作 。 
现实 中 存在 多 种 常见 的 处 理 任务 ,这 就 要 求 我 们 编写 代码 来 简单 、 高 效 地 处 理 这 些 任务 。 对 
程序 员 来 说 , 需要 考虑 的 问题 有 : 
® 数据 类 型 多 种 多 样 。 
s 存在 多 种 可 选 的 数据 存储 方法 。 
se 对 数据 集合 的 操作 也 是 千变万化 。 
为 了 尽 可 能 降低 这 些 问题 的 影响 , 我 们 希望 编写 的 代码 能 够 同时 处 理 各 种 数据 类 型 , 同时 处 
理 各 种 数据 存储 方法 , 同时 适用 于 各 种 处 理 任务 。 总 之 , 我 们 想 通 过 代码 一 般 化 来 处 理 各 种 变化 
情况 。 我 们 要 避免 对 每 一 个 问题 都 从 头 开 始 寻 找 处 理 方 法 , 那样 会 浪费 大 量 的 时 间 。 
为 了 编写 能 够 达到 上 述 目 的 代码 , 我 们 首先 用 更 加 抽象 的 方式 来 看 待 我 们 要 对 数据 进行 的 处 
理工 作 : 
e 收集 数据 并 装 人 容器 
a 例如 vector、list 和 数组 
组 织 数 据 
= 打印 
a 快速 访问 
提取 数据 
s 根据 索引 (例如 , 第 42 个 元 又 ) 
s 根据 值 (例如 , 年 龄 字段 是 7 的 第 一 个 元 素 ) 
a 根据 属性 (例如 , 所 有 温度 字段 大 于 32 且 小 于 100 的 元 素 ) 
。 修改 容器 
”增加 数据 
= 减少 数据 
a 排序 (根据 某 种 规则 ) 
。 进行 简单 的 数值 运算 (例如 , 将 每 一 个 元 素 乘 以 1.7) 
在 完成 上 述 任务 时 要 避免 陷 人 各 种 细节 之 中 : 各 种 容器 之 间 的 差别 、 各 个 访问 数据 元 素 方法 
的 差别 和 各 种 数据 类 型 的 差别 。 人 全 同时 高 效 、 通 用 的 代 
码 的 目标 迈 出 了 一 大 步 。 
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回顾 前 面 几 章 介绍 的 编程 工具 和 技术 , 我 们 (已 经 ) 可 以 编写 功能 相似 , 但 与 数据 类 型 无 关 的 
代码 : 

。 使 用 int 与 使 用 double 基本 没有 差异 。 

e 使 用 vector < int > 与 使 用 vector < string > 基本 没有 差异 。 

e 使 用 double 类 型 的 数组 与 使 用 vector < double > 基本 没有 差异 。 

我 们 希望 只 有 当 我 们 想 要 完成 一 些 全 新 的 任务 时 才 知 要 编写 新 的 代码 。 而 且 , 我 们 还 希望 编 
写 一 些 能 够 完成 基本 任务 的 代码 ， 人 也 无 需 从 
头 开始 编写 新 的 代码 。 

。 在 vector 与 数组 中 查找 数据 的 方法 差异 不 大 。 

。 查找 字符 串 时 不 区 分 大 小 写 与 区 分 大 小 写 的 差异 不 大 。 

。 使 用 准确 值 与 使 用 近似 值 画图 的 差异 不 大 。 

e 找 贝 文件 与 拷贝 vector 对 象 的 差异 不 大 。 

根据 上 面 的 观察 , 我 们 编写 的 代码 应 具有 以 下 特点 : 

。 容易 阅读 

。 容易 修改 

。 规范 

。 简短 

。 快速 

为 了 简化 编程 工作 , 我 们 会 : 

。 使 用 统一 的 方式 访问 数据 

a 与 数据 存储 方法 无 关 
s 与 数据 类 型 无 关 

。 使 用 类 型 安全 的 方式 访问 数据 
便于 遍历 数据 
压缩 数据 存储 空间 
。 快速 
=。 提取 数据 
= 增加 数据 
a 删除 数据 
对 通用 算法 提供 标准 实现 
= 例如 拷贝 、 查 找 、 搜 索 、 排 序 、 求 和 等 
STL 提供 了 上 述 功 能 以 及 更 多 的 其 他 功能 。STL 不 仅 是 一 个 强大 的 功能 库 ， 而 且 是 一 个 兼 顾 灵 活 
性 与 实现 性 能 的 孙 数 库 设计 的 典范 。STL 由 Alex Stepanov 设计 , 是 一 个 通用 、 正 确 和 高 效 的 算法 
框架 。 其 设计 理念 体现 在 算法 实现 的 简单 性 、 通 用 性 和 优雅 性 。 

除了 使 用 设计 思路 清楚 、 代 码 逻 辑 性 强 的 框架 来 处 理 数据 之 外 ; 另 一 种 策略 是 让 程序 员 根 据 
每 个 具体 任务 的 特定 情况 选择 处 理 方法 ,并 且 从 头 开 始 实现 程序 代码 , 这 种 方式 费时 费力 。 不 仪 
如 此 , 得 到 的 程序 代码 往往 非常 糟糕 ， 豪 无 章法 可 言 ， 本 而 且 在 其 他 
场合 能 够 复 用 的 可 能 性 微乎其微 。 

在 介绍 完 STL 的 设计 初 囊 和 理念 之 后 , 我 们 会 给 出 STL 的 一 些 基本 定义 ， 最 后 通过 例子 展示 
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如 何在 实际 应 用 中 运用 这 些 基 本 理念 : 编写 更 好 的 处 理 数 据 的 代码 , 而 且 让 编写 过 程 更 简单 。 
20.3 序列 和 迭代 器 


序列 是 STL 中 的 核心 概念 。 从 STL 的 角度 来 看 ,数据 集合 就 是 一 个 序列 。 序 列 具 有 头 部 和 尾 
部 。 我 们 可 以 对 一 个 序列 从 头 部 到 尾部 进行 遍历 , 对 序列 中 的 元 素 进行 有 选择 的 读 写 操作 。 我 们 
利用 一 对 迭代 器 来 完成 读 序列 头 部 和 尾部 的 判断 。 迭 代 器 是 一 个 可 以 标识 序列 中 元 素 的 对 象 。 
我 们 可 以 按照 如 下 图 所 示 的 方式 来 看 待 一 个 序列 : : 





这 里 的 begin 与 end 就 是 迭代 器 , 它们 标识 了 序列 的 头 部 和 尾部 。 通 常 称 STL 的 序列 是 “ 半 开 ”的 ， 
因为 由 begin 所 标识 的 元 素 是 序列 的 一 部 分 , 而 迭代 器 end 通常 指向 序列 尾部 后 面 一 个 位 置 。 在 
数学 中 , 这 种 序列 (区 间 ) 可 以 表示 为 [begin: end) 。 两 个 元 素 间 的 箭头 表示 如 果 有 一 个 指 回 第 一 
个 元 素 的 迭代 器 , 那么 我 们 就 可 以 得 到 一 个 指向 第 二 个 元 素 的 迭代 器 。 

那么 究竟 什么 是 迁 代 器 呢 ? 和 迭代 器 是 一 个 相当 抽象 的 感念 : 

e。 迁 代 器 指 回 序 列 中 的 某 个 元 素 ( 或 者 序列 末端 元 素 之 后 ) 。 

e。 可 以 使 用 == 和 1!= 来 对 两 个 迭代 器 进行 比较 。 

e。 可 以 使 用 单 目 运算 符 来 访问 迭代 器 所 指向 的 元 素 。 

。 可 以 利用 操作 符 ++ 来 使 迁 代 器 指 问 下 一 个 元 素 。 

举例 来 说 , 如果 p 和 q 是 两 个 指向 同一 个 序列 的 两 个 迭代 器 : 


标准 选 代 器 的 基本 操作 

pP==dq 当 且 仅 当 P 和 9q 指向 序列 中 的 同一 个 元 素 或 都 指向 有 
pi=dq !〈《pP==d) 

“Pp 表示 p 所 指向 的 元 素 

*p = val 对 p 所 指向 的 元 素 进行 写 操作 

val =*p 对 p 所 指向 的 元 素 进行 读 操 作 

++P 使 p 指向 序列 中 的 下 一 个 元 素 或 序列 末端 元 素 之 后 


很 明显 ,迭代 器 的 概念 与 指针 ( 见 17.4 节 ) 是 相关 的 。 实 际 上 , 指向 数组 中 某 一 元 素 的 指针 
就 是 一 个 迭代 器 。 但 是 , 许多 迭代 器 不 仅仅 是 指针 ; 比如 说 , 我 们 可 以 定义 一 个 边界 检查 的 迭代 
器 ， 当 试图 使 它 指向 [begin: end) 之 外 的 内 容 时 就 会 抛 出 异常 。 把 迭代 器 定义 成 一 种 抽象 的 标识 
而 不 具体 指定 类 型 可 以 给 我 们 带 来 很 大 的 灵活 性 和 通用 性 。 本 章 和 第 21 章 将 会 举例 说 明 这 一 点 。 

试 一 试 ”编写 一 个 函数 void copy(int fi ,int el, int" 人 2), 该 函数 把 [入 :el) 定 义 的 int 

型 数组 复制 到 数组 [ 亿 : 亿 + (el -f)) 中 。 注 意 只 “能 使 用 上 面 所 提 到 的 选 代 器 操作 (不 能 

用 索引 )。 

我 们 可 以 利用 迭代 器 来 实现 代码 (算法 ) 与 数据 的 连接 。 程 序 编写 人 员 了 解 迭 代 器 的 使 用 方 
法 (并 不 需要 了 解 迭代 器 是 如 何 访 问 数 据 的 ), 数据 提供 者 向 用 户 提 供 相应 的 迭代 器 而 不 是 数据 存 
储 的 细节 信息 。 这 样 得 到 的 是 一 个 简单 的 程序 结构 , 而 且 使 算法 和 容器 之 间 保 持 了 很 好 的 独立 
性 。 正 如 Alex Stepanov 所 说 :“STL 算法 和 容器 可 以 共同 完成 很 强大 的 功能 , 而 这 却 是 因为 它们 根 
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本 不 知道 对 方 的 存在 。 但 是 ,它们 都 知道 由 一 对 迭代 器 所 定义 的 序列 。 


sort. find. search. copy. .... my_very_own _algorithm. your_code, ... 





vector. list. map, array. ..., my_container. your_container.... 


换 句 话说 , 我 们 的 代码 不 再 需要 知道 存储 和 访问 数据 的 不 同方 法 ; 它 只 需要 对 迭代 器 有 一 和 定 
的 了 解 。 另 一 方面 , 作为 数据 提供 方 , 我 们 不 再 需要 为 不 同 的 用 户 分 别 编写 代码 ; 我 们 只 需要 为 


数据 配备 好 合适 的 迭代 器 。 实 际 上 , 最 简单 的 迭代 器 只 是 由 、++ 、== 、!= 等 操作 所 定义 的 , 这 
无 疑 会 使 它 变 得 既 方便 又 快速 。 

STL 框架 包含 大 概 10 种 容器 和 60 种 由 迭代 器 相连 接 的 算法 (参见 第 21 章 ) 。 为 外, 许多 组 织 
和 个 人 都 在 开发 符合 STL 风格 的 容器 和 算法 。STL 可 能 是 目前 最 著名 的 泛 型 编程 的 例子 (参见 
19.3.2 节 )。 只 要 了 解 了 它 的 基本 概念 和 一 些 简单 的 例子 , 你 就 可 以 很 容易 地 掌握 其 他 相关 的 
内 容 。 
20. 3.1 回 到 实例 

下 面 我 们 来 看 看 如 何 使 用 STL 来 描述 问题 “查找 序列 中 的 最 大 元 素 ”: 


template<class iterator > 
lterator high(lterator first, lterator fast) 
// return an iterator to the element in [first:last) that has the highest value 
{ 

lterator high = first; 

for (iterator p = first; p1=last; ++p) 

if (*high<*p) high = p; 

return high; 

} 


注意 , 我 们 去 掉 了 用 来 存储 当前 所 找到 的 最 大 元 素 的 变量 h。. 当 我 们 不 能 确定 序列 中 元 素 的 
类 型 时 , 使 用 -1 来 完成 初始 化 看 起 来 很 奇怪 。 这 是 因为 它 确实 很 奇怪 ! 而 且 迟 早 这 会 导致 一 些 
错误 的 发 生 : 因为 在 我 们 的 例子 中 不 会 存在 负 的 速度 ,所 以 它 不 会 在 这 里 出 错 。 我 们 要 记 住 
像 -1 这 样 的 “ 魔 数 ” 是 非常 不 利于 程序 的 维护 的 (参见 4,3.1 节 、7. 6. 1 节 、10. 11. 1 节 等 ) 。 它 会 
限制 住 我 们 所 定义 的 隔 数 的 使 用 范围 , 并 说 明 我 们 对 问题 还 没有 形成 一 个 比较 全 面 的 认识 , 也 就 
是 说 ,“ 魔 数 ” 是 一 种 偷懒 的 表现 。 

”注意 , 这 里 的 high( ) 可 以 被 用 于 所 有 可 以 使 用 < 进行 比较 的 元 素 类 型。 比如 ， 我 们 可 以 利用 

high( ) 来 查找 vector < string > 中 按 字典 顺序 最 靠 后 的 字符 串 ( 参 见 练习 7) 。 

high( ) 模 板 函 数 可 以 在 任何 由 一 对 迭代 器 定义 的 序列 中 使 用 。 举例 来 说 ， 可 以 按照 如 下 方 式 
改写 我 们 的 例子 : 


double* get_from _jack(int* count); /jack puts doubles into an array and 
// returns the number of elements in *count 
vector<double>* get from_jill); WJill fills the vector 


voidfct) 
{ 
int jack_count = 0; 
double* jack_data = get_from_jack(&jack_count); 
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vector<double>* jil_data = get_from_jil0; 


double* jack_high = high(iack_data,jack_data+jack_countf); 
vector<double>& v = *jill_data; 
double* jil_high = high(&vIO0], &vIO]}+v.,size()); 
cout << "Jill's high ” << *jill_ high << "; jack's high ”<< *jack_high; 
人 
delete[] jack_data; 
delete jill_data; 
} 


这 里 的 两 个 调用 中 , high( ) 中 的 迭代 器 模板 参数 的 类 型 为 double* 。 除 了 确保 high( ) 被 正确 
实现 外 , 这 和 我 们 之 前 的 例子 没有 任何 区 别 。 更 具体 地 说 ,所 运行 的 代码 并 没有 什么 不 同 , 但 在 
代码 的 通用 性 上 却 有 很 大 的 区 别 。 这 里 的 模板 版 本 的 high( ) 适 用 于 任何 由 一 对 迭代 器 所 定义 的 
序列 。 在 进一步 了 解 STL 的 细节 和 所 提供 的 算法 之 前 , 我 们 先 来 了 解 集中 对 数据 元 素 集 合 进行 存 
储 的 方法 。 
试 一 试 在 我 们 的 程序 中 有 一 个 严重 的 错误 。 请 找到 并 修改 它 ， OT 种 针对 这 
种 问题 的 通用 解决 方法 。 


20.4 链表 
下 面 让 我 们 再 回顾 一 下 序列 概念 的 图 形 表示 : 





将 它 与 我 们 描绘 vector 内 存 结构 的 示意 图 相 比 较 : 





下 标 0 本 质 上 与 迭代 器 v. begin( ) 一 样 都 指向 同一 个 元 素 ， 并 且 下 标 v. size( ) 与 v. end( ) 一 样 都 指 
向 最 后 一 个 元 素 之 后 的 位 置 。 

vector 的 元 素 在 内 存 中 是 连续 排列 的 。 而 在 STL 的 概念 中 , 序列 在 内 存 中 的 排列 不 一 定 都 是 
连续 的 , 因此 在 STL 中 , 很 多 算法 在 将 一 个 元 素 插 人 已 有 元 素 的 中 间 时 都 不 需要 移动 已 有 的 元 
素 。 上 面 对 序 列 抽象 概念 的 图 形 描述 意味 着 ， 在 不 移动 其 他 元 素 的 前 担 下 进行 元 素 插 人 (或 元 素 
删除 ) 操作 成 为 了 可 能 。STL 迭代 器 的 概念 支持 了 上 述 操作 。 

体现 上 述 STL 示意 图 所 描绘 序列 概念 的 最 常见 的 数据 结构 是 链表 。 在 抽象 模型 中 的 箭头 通 
常 由 指针 实现 。 链 表 中 的 一 个 元 素 是 “链接 ”的 一 部 分 , 该 “链接 ”由 这 一 元 素 以 及 一 个 或 多 个 指 
针 组 成 。 如 果 链 表 的 一 个 链接 只 包含 一 个 指针 , 我 们 称 这 样 的 链表 为 单 向 链表 ,如 果 一 个 链接 包 
含 一 个 指向 前 驱 链接 的 指针 以 及 一 个 指向 后 继 链接 的 指针 , 则 这 样 的 链表 为 双向 链表 。 在 后 续 小 
节 中 , 我 们 将 勾画 一 个 双向 链表 的 实现 , 且 该 实现 与 C++ 标准 库 list 的 实现 相同 。 双向 链表 的 概 
念 可 以 由 图 形 描绘 , 如 下 所 示 : 
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上 述 概 念 可 由 下 列 代 码 实 现 : 
template<class Elem;> struct Link { 
Link* prev; // previous link 
Link* succ;  / successor (next) link 
Elem vaj; // the value 


}; 


template<class Elerm> struct list { 
Link<Elem>* first; 
Link<Elem>* last; // one beyond the last link 


}; ; 
Link 的 结构 如 右 图 所 示 。 链表 的 实现 和 表示 方法 有 多 种 ,附录 B 中 给 出 了 
标准 库 所 采用 的 一 种 方法 。 在 本 节 中 ,只 概述 一 下 链表 的 关键 属性 一 一 我 
们 能 够 在 不 影响 其 他 已 有 元 素 的 前 提 下 插入 和 删除 元 素 一 一 展示 如 何在 链 
表 中 进行 迭代 , 以 及 给 出 链表 使 用 方法 的 一 个 示例 。 

当 你 考虑 使 用 链表 时 , 我 们 强烈 建议 你 将 自己 所 考虑 的 链表 操作 通过 
图 形 进 行 描述 。 图 形 是 描绘 链表 操作 的 一 种 十 分 有 效 的 方法 。 
20. 4.1 列表 操作 

对 于 列表 , 我 们 需要 使 用 哪些 操作 呢 ? 

e 对 vector 所 实现 的 操作 (构造 函数 、 大 小 等 ) , 除了 下 标 操作 。 

。 插 人 (添加 一 个 元 素 ) 和 删除 ( 移 除 一 个 元 素 ) 。 

。 访问 元 素 以 及 遍历 列表 : 迭代 器 。 

在 STL 中 ,上 述 和 迭代 器 的 类 型 是 list 类 的 一 个 成 员 , 因此 有 : 


template<class Elem> class list { 

// representation and implementation details 
public: 

class iterator; I/ member type: iterator 








iterator begin();  // iterator to first element 
iterator end!( ); // iterator to one beyond jast element 


iterator insert(iterator p, const Elem& v); // insert v into list after p 
iterator erase(iterator p); lf remove p from the list 


-void push_back(const Elem& v); /insertv at end 
void push_front(const Elem& v); /insert v at front 
void pop_front(); // remove the first element 
void pop_back(); // remove the last element 


Elem& front(); // the first element 
Elem& back'(); // the last element 


1... 

}; 
就 像 “我 们 的 ”vector 并 没有 完全 实现 标准 库 vector 一 样 ， 上 述 list 定义 与 标准 库 list 定义 也 不 完全 
相同 。 但 上 述 list 中 没有 任何 错误 ; 它 仅仅 是 不 完全 而 已 。“ 我 们 的 ”list 的 目的 在 于 加 深 你 对 链 
表 的 理解 : 链表 是 什么 ，list 应 该 如 何 实现 , 以 及 如 何 使 用 list 的 关键 特性 。 如 果 读 者 想 获 得 更 多 
的 信息 , 请 参考 附录 B 或 其 他 专家 级 别 的 C++ 书籍。 

迭代 器 是 STL list 定义 中 的 核心 部 分 。 和 迭代 器 用 于 标示 元 素 反 人 的 位 置 以 及 待 删除 的 元 素 
( 擦 除 ) 。 它 们 也 可 用 于 在 链表 中 进行 “导航 ”。 和 迭代 器 的 这 一 用 途 与 我 们 在 20.1 节 和 20.3.1 节 
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中 使 用 指针 遍历 数组 和 向 量 十 分 相似 。 送 代 器 的 这 一 风格 对 于 标准 库 任 颖 而 童 十 分 天 娠 ( 碎 见 
21.1 ~21.3 节 )。 

为 什么 不 在 list 中 使 用 下 标 操作 呢 ? 我 们 可 以 为 list 实现 下 标 操 作 , 但 下 标 操作 是 一 种 极为 
缓慢 的 操作 : list[ 1000 ] 操作 将 会 从 第 一 个 元 素 开 始 访问 , 直到 被 访问 元 素 的 数目 到 达 1000 为 止 。 
如 果 想 要 这 么 做 , 那么 我 们 可 以 自己 实现 这 一 操作 (或 使 用 advance( ) ; 车 20. 6.2 节 )。 因此 ， 
标准 库 list 并 没有 提供 下 标语 法 。 

将 迭代 器 的 类 型 作为 list 的 成 员 ( 一 个 骸 套 类 ) 的 原因 在 于 , 我 们 没有 任何 理由 将 迭代 器 的 类 
型 实现 为 全 局 类 。 这 一 迭代 器 的 类 型 将 只 会 由 list 类 使 用 。 另 外 , 这 也 使 得 我 们 能 够 将 每 个 容器 
的 选 代 器 都 命名 为 iterator。 在 标准 库 中 存在 着 list <T> :: iterator、 vector <T > :: iterator、map < 开 ， 
V > :: iterator 等 迭代 毅 类 型 。 : 

20. 4.2 和 迁 代 

列表 迭代 器 必须 提供 ”、++ 、== 和 != 操作 。 因 为 标准 库 中 的 列表 为 双向 链表 , 它 还 提供 了 

-= 操作 ,以 实现 链表 的 “从 后 " 往 前 的 迭代 操作 : 


template<class Elem> class list<Elem>: :iterator { 
Link<Elem>* curr; current link 

public: 
iterator(Link* p) :curr(p) {} 


iterator& operator++() {curr = curr—>succ; return *this; } // forward 
iterator& operator——{) { curr = curr—>prev; return *this; }// backward 
Elemé& operator*() { return curr—>val; } // get value (dereference) 


bool operator==(const iterator& b) const { return curr==b.curr; } 
bool operator!= (const iterator& b) const { return curr!=b.curr; } 
}; 


这 些 函数 十 分 简明 且 极 具 效 率 : 函数 实现 中 不 存在 循环 , 不 存在 复杂 的 表达 式 , 不 存在 “可 疑 
的 ” 阴 数 调用 。 如 果 你 还 不 清楚 这 些 实现 的 意义 , 请 再 快速 回顾 一 下 前 面 的 示意 图 。 这 一 list 迭 
代 器 只 是 一 个 指向 链接 的 指针 。 注 意 ,， 尽管 list < Elem > :: iterator 的 实现 (代码 ) 与 我 们 在 vector 
和 数组 中 用 作 和 迭代 器 的 简单 指针 的 实现 极为 不 同 , 但 两 者 操作 的 意义 (语义 ) 是 相同 的 。List itera- 
tor 提供 了 对 Link 指针 的 ++ 、--、”、== 和 != 操 作 。 


现在 让 我 们 再 次 回顾 high( ) 的 实现 ; 

template<class lterator > 

lterator high(iterator first, tierator last) 

j return an iterator to the element in [first,last) that has the highest value 


lterator high = first; 

for (lterator p = first; pl=last; ++p) 
if (*high<*p) high = p; 

return high; 

} 


我 们 可 以 将 其 用 于 list; 
void f() 
{ 
list<int> lst; 
int x; 


While (cin >> x) lst.push_front(x); 


list<int>: :iterator p = high(lst.begin(), lst.end()); 
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cout << "the highest value was "<< *p << endl; 


} 

在 上 述 代码 中 ，Iterator 参数 的 “ 取 值 ”为 list < int > :: iterator, 并 且 ++、 “和 != 操作 的 实现 都 
与 在 数组 情况 下 有 很 大 不 同 , 但 操作 意义 是 相同 的 。 模 板 函 数 high( ) 仍然 遍历 数据 (在 这 里 是 
list) 和 查找 最 大 值 。 我 们 可 以 在 list 的 任何 位 置 插入 一 个 元 素 , 因此 使 用 了 push_front( ) 在 链表 首 
部 添加 元 紊 , 而 这 一 操作 的 目的 仅仅 是 为 了 显示 我 们 确实 能 够 这 么 做 。 当 然 , 也 可 以 像 对 vector 
使 用 push_back( ) 阻 数 一 样 对 list 使 用 push_back() 晴 数 。 

试 一 试 ”标准 库 vector 不 提供 push_front( )。 为 什么 ? 为 vector 实现 push_front( ) 并 

将 其 与 push_back( ) 进 行 比较 。 

现在 , 是 时 候 提 出 这 样 的 问题 了 ,“ 如果 list 为 空 会 怎样 ? 换 句 话说,“ 如 采 lst begin( ) = 
lst end( ) 会 怎样 ?在 这 种 情况 下 ， p 将 会 试图 对 最 后 一 个 元 素 之 后 的 位 置 进行 解 引 用 , ls. end( ) : 
这 是 一 个 灾难 ! 或 者 (可 能 更 粳 地 ) 结 采 可 能 是 一 个 错误 的 随机 值 。 

上 面 这 个 问题 的 形成 给 我 们 带 来 了 一 个 提示 : 我 们 可 以 通过 比较 begin( ) 和 end( ) 测试 一 个 





begin: eS | 






结束 判断 任何 STL 序列 是 否 为 空 ， 如 右 图 所 示 。 这 是 使 序列 

的 end 指向 最 后 一 个 元 聚 之 后 的 位 置 而 不 是 指向 最 后 一 个 元 

素 的 一 个 更 深层 次 的 原因 : 空 序 列 不 是 一 种 特殊 情况 。 我 们 

不 喜欢 特殊 情况 , 因为 (根据 定义 ) 我 们 不 得 不 为 这 些 特 殊 的 情况 编写 特殊 的 代 疤 。 
在 我 们 的 例子 中 , 我 们 可 以 按 如 下 方式 对 list 进行 测试 : 


list<int>::iterator p = high(jst.begin(0, lst.end0); 
if (p==ist.end0) /did we reach the end? 
cout << "The list is empty'; . 站 
else 
cout << "the highest value is " << *p << endl; 


我 们 采用 这 种 形式 的 测试 方法 系统 地 测试 STL 算法 。. 
因为 标准 库 提供 了 链表 , 我 们 在 这 里 不 再 继续 深入 探讨 它 的 具体 实现 。 取 而 代 之 的 是 , 我 们 
将 简要 讨论 链表 适用 的 场合 (参考 练习 12 ~14, 如 果 你 对 链表 的 实现 细节 感 兴趣 ) 。 


20.5 ”再 次 一 般 化 vector 


显然 , 通过 20.3 ~ 20.4 节 的 例子 我 们 发 现 , 标准 库 向 量 包含 一 个 iterator 成 员 类 型 以 及 
begin( ) 和 end( ) 成员 函数 (与 std::list 类 似 )。 然 而 , 我 们 并 没有 在 第 19 章 中 为 我 们 的 vector 类 
提供 这 些 成 员 。 那 么 , 对 于 不 同类 型 的 容器 而 言 , 它们 究竟 采用 了 什么 方法 ,以 使 它们 或 多 或 少 
地 能 够 在 20. 3 节 所 表达 的 STL 泛 型 编程 风格 中 被 互 换 地 使 用 ? 首先 , 我 们 将 简要 介绍 一 种 解决 
方案 (为 简化 方案 , 我 们 忽略 了 分 配器 ) , 然后 再 对 解决 方案 进行 解释 ; 


template<class T> class vector { 
public: 
typedef unsigned long size_type; 
typedefT value_type; 
typedef T* iterator; 
typedef const T* const_iterator; 


1/... 
iterator begin(); 


const_iterator begin() const; 
iterator end(); 
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const iterator end() const; 
size_type size(); 
J 
}; 
typedef 为 一 个 类 型 提供 了 别名 , 也 就 是 说 , 对 于 我 们 的 vector，iterator 是 我 们 在 vector 中 用 做 
迭代 器 的 类 型 一 -T 的 一 个 同 义 字 , 一 个 别名 。 现 在 ,对 于 vector 对 象 v, 我 们 可 以 编写 如 下 
代码 : 
vector<int>: :iterator p = find(v.begin(), vend(),32); 
以 及 
for (vector<int>: :size_type i = 0; ji<v.size(); ++i) cout <<vIi]] << An 
通过 别名 的 方式 , 我 们 事实 上 不 需要 知道 iterator 和 size_type 的 实际 类 型 。 特 别 地 , 因为 上 述 ， 
代码 使 用 了 iteartor 和 size_type, 也 可 以 用 于 那些 size_type 不 为 unsigned long 类 型 (在 很 多 般 人 式 
系统 中 ,size_type 为 其 他 类 型 ) 并 且 iterator 为 类 而 不 是 简单 指针 (这 种 情况 在 C++ 实现 中 很 普遍 ) 
的 vector 对 象 。 
标准 以 相似 的 方式 定义 了 list 和 其 他 标准 容器 。 例 如 : 
template<class Elem> class list { 
public: 
class Link; 
typedef unsigned Iong size_type; 
typedef Flem value_type; 
class iterator; /see §20.4.2 


class const_iterator; // like iterator, 
// but not allowing writes to elements 


Ws 


iterator begin(); 
const_iterator begin() const; 
iterator end(); 

const_iterator end() const; 


size_type size(); 
/ee 
}»; . 
因此 , 我 们 可 以 编写 自己 的 代码 , 而 不 需要 关心 代码 使 用 了 list 还 是 向 量 。 所 有 标准 库 算 法 中 都 
使 用 了 上 述 这 些 容器 的 成 员 类 型 名 字 , 例如 iterator 和 size_type, 所 以 , 算法 的 实现 不 依赖 于 容器 
的 实现 或 者 它们 具体 操作 的 容 絮 (参见 第 21 章 )。 


20.6 实例 : 一 个 简单 的 文本 编辑 咒 


列表 最 重要 的 性 质 就 是 可 以 在 不 移动 元 素 的 情况 下 对 其 进行 插入 或 删除 操作 。 下 面 我 们 通 
过 一 个 例子 来 说 明 这 一 点 。 考 虑 应 该 如 何在 文本 编辑 器 中 表示 一 个 文本 文件 中 的 字符 。 所 选用 
的 表示 方式 应 当 能 够 使 对 文本 文件 进行 的 操作 简单 而 且 高 效 。 

那么 具体 会 涉及 哪些 操作 呢 ? 假设 文件 存储 在 计算 机 的 内 存 中 。 也 就 是 说 , 我 们 可 以 选择 
任何 一 种 表示 方式 , 而 当 需 要 保存 到 文件 中 时 , 只 要 把 它 转换 成 一 个 字 节 流 就 可 以 了 。 相 似 
地 , 我 们 也 可 以 把 一 个 文件 中 的 字符 转 成 字 节 流 , 从 而 把 它 读 人 到 内 存 中 。 这 说 明 我 们 只 需要 
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选择 一 种 合适 的 内 存 中 的 表示 方式 就 可 以 了 。 所 选择 的 表示 方式 需要 能 够 很 好 地 支持 以 下 5 
种 操作 : 

。 从 输入 的 字 节 流 创建 该 表示 方式 。 

。 插入 一 个 或 多 个 字符 。 

。 删除 一 个 或 多 个 字符 。 

e 查找 一 个 string。 

。 产生 一 个 字 节 流 从 而 输出 到 文件 或 屏幕 。 

最 简单 的 表示 方式 就 是 vector < char > 。 但 是 , 在 vector 中 , 每 加 入 或 删除 一 个 元 素 时 我 们 就 
需要 移动 后 面 所 有 的 元 素 。 例 如 : 


This is he start of a very long document. 
There are lots of . . . 


我 们 希望 加 入 字符 t; 


This is the start of a very long document. 
There are lots of . , ， 


如 采用 vector < char > 来 存储 这 些 字符 , 那么 就 需要 把 从 h 开始 的 所 有 字符 都 向 右 移动 , 这 有 
可 能 会 导致 大 量 的 复制 操作 。 实 际 上 , 如 果 要 在 一 篇 70 000 字 的 文本 中 插入 或 删除 一 个 字符 , 那 
么 平均 需要 移动 35 000 个 字符 。 它 所 需要 的 执行 时 间 会 很 长 , 使 我 们 难以 接受 。 因 此 , 不 妨 把 我 
们 的 表示 方式 分 成 几 块 , 这 样 就 可 以 在 不 需要 移动 很 多 元 素 的 情况 下 对 文本 的 某 一 部 分 进行 修 
改 。 我 们 把 文本 文件 看 成 由 一 系列 “ 行 "组 成 , 并 用 list < Line > 进行 表示 , 其 中 Line 是 一 个 vector 
< char > 。 例 如 : 





的 话 , 我 们 可 以 插入 新 的 一 行 而 不 需要 移动 任何 元 素 。 例 如 , 我 们 可 以 在 “document” 后面 加 入 字 
符 串 “This is a new line. ”, 可 以 得 到 


This is the start of a very long document. 
This is a new line. 
There are lots of . . 
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我 们 可 以 在 不 影响 现 有 连接 的 情况 下 在 list 中 加 入 新 的 连接 。 这 一 点 非常 重要 ,因为 相应 
的 迭代 器 正 是 指向 现 有 连接 的 。 这 样 迭 代 器 就 不 会 被 对 list 的 插入 或 删除 操作 影响 。 比 如 , 文 
字 处 理 器 利用 vector < list < Line > :: iterator > 来 存储 指向 当前 Document 的 标题 和 子 标题 的 迭 
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本 
我 们 可 以 在 不 影响 指向 “20. 3 段 " 的 迭代 其 的 情况 下 向 “20. 2 段 " 加 入 新 的 行 。 

也 就 是 说 , 出 于 性 能 和 逻辑 上 的 考 虚 , 我 们 采用 的 是 一 个 针对 “ 行 ” 的 list, 而 不 是 “ 行 ” 的 vec- 
tor 或 一 个 存储 所 有 字符 的 vector。 需 要 注意 的 是 , 由 于 这 种 情况 很 少 出 现 , 我 们 前 面 提 到 的 “尽量 
使 用 vector 的 准则 仍然 适用 。 如 采 要 用 list 蔡 代 vector, 那么 你 最 好 有 充分 的 理由 说 服 你 自己 ( 参 
见 20.7 节 ) 。 无 论 list 还 是 vector 都 可 以 表示 逻辑 上 的 “列表 ”结构 。STL 中 和 我 们 日 常 所 说 的 列 
表 最 为 详尽 的 是 序列 , 而 绝 大 多 数 序 列 是 由 vector 表示 的 。 

20. 6. 1 处理 行 z | 

立 该 如 何在 文件 中 判断 一 行 呢 ?有 三 种 方法 很 容易 想到 : 

1) 靠 换 行 符 (例如 '\n') 来 判断 。 

2) 通过 某 种 自然 语言 处 理 的 方式 , 对 文件 进行 分 析 ， 从 而 进行 判断 (如 . )。 

3) 把 所 有 过 长 的 行 (比如 超过 50 个 字符 ) 都 分 成 两 行 。 
当然 还 有 其 他 方法 。 这 里 我 们 选择 第 一 种 方法 来 判断 。 

我 们 把 编辑 器 中 的 文件 表示 成 Document 类 的 一 个 对 象 , 如 下 所 示 : 


typedef vector<char> Line; /alineis avector of characters 


struct Document { 
list<Line> line; /a document is a list of lines 
// lineli] is the ith line 
Document() {line.push_back(Line()); } 
}; 
每 个 Document 对 象 都 以 一 个 空 行 开始 : Document 的 构造 函数 会 创建 一 个 空 行 并 把 它 加 入 到 行 的 
列表 中 。 


把 文件 分 行 的 操作 可 以 按照 如 下 方式 完成 : 


istream& operator>(istreama& is, Document& d) 


{ 
char ch; 
while (is .get(ch)) { 
~ d.line.back().push_back(ch); /add the character 
if (ch=="\n') 
d.line.push_back(Line0); //add another line 
} 
return is; 
} 


vector 和 list 都 有 一 个 可 以 返回 对 末端 元 素 引 用 的 back( ) 操 作 。 但 使 用 back( ) 时 一 定 要 确定 
确实 存在 末端 元 素 : 不 要 在 一 个 空 容 器 上 使 用 它 。 这 也 是 为 什么 我 们 会 对 每 一 个 Document 对 象 
插入 一 个 空 Line 的 原因 。 注意 我 们 会 对 输入 的 每 个 字符 都 进行 存储 ， 包 插 换行 符 ('\n')。 这 会 
给 我 们 后 面 的 判断 带 来 很 大 的 方便 。 
20. 6.2 迭代 

如 果 用 vector < char > 来 存储 文件 , 那么 在 它 上 面 使 用 迭代 器 就 方便 多 了 。 那 么 如 何在 一 个 行 
的 列表 上 使 用 迭代 器 呢 ? 我 们 当然 可 以 使 用 list < Line > :: iterator。 但 如 果 我 们 希望 可 以 在 不 考虑 
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断 行 的 同时 对 字符 进行 处 理 呢 ? 为 此 , 我 们 针对 Document 类 定义 一 个 专门 的 迭代 器 : 


class Text_iterator { /keep track of line and character position within a line 
list<Line>: :iterator In;- 
Line: :iterator pos; 
public: 
// start the iterator at line Ill’s character position pp: 
Text_iterator(list<Line>: :iterator 儿 Line: :iterator pp) 
:In(ID), pos(pp) {} 


char& operator*() { return *pos; } 
Text_iterator& operator++(); 


bool operator==(const Text_iterator& other) const 
{ return In==other.In && pos==otherpos; } 

bool operator!=(const Text_iterator& other) const 
{return 1(*this==other); } 


}»; 
Text_iterator& Text_iterator: :operator++() 
{ 
if (pos==(*In).end()) { 
++In; /AH proceed to next line 
pos = (*In).begin(); 
} 
++Ppos; // proceed to next character 
return *this; 
} . 
为 了 更 好 地 发 挥 Text_iterator 的 作用 , 我 们 为 Document 定义 begin( ) 和 end( ) 操 作 : 
struct Document { 


list<Line> line; 


Text_iterator begin() // first character of first line 
{return Text_iterator(line.begin(), (*line.begin()).begin()); } 
Text_iterator end() / one beyond the last line 
{ 
list<Line> :: iterator last = line.end(); 


-~last; // we know that the document is not empty 
return Text_iterator(last , (*last) .end()); 


}; 


上 面 的 (“line. begin( ) ). begin( ) 是 为 了 使 我 们 可 以 访问 ine begin( ) 所 指向 的 数据 。 当 然 , 由 于 标 
准 库 的 先 代 器 指针 -> 操作 符 , 我 们 也 可 以 使 用 line. begin( ) ->begin()。 
现在 我 们 可 以 按照 如 下 方式 对 文件 的 字符 进行 访问 了 : 


void print(Document& d) 
{ 

for (Text_iterator p = d.begin(); pi=d.end(); ++p) cout << *p; 
} 


print(my_doc); 


把 文件 作为 一 个 字符 序列 来 处 理 可 以 给 我 们 带 来 很 大 的 方便 , 但 有 时 候 我 们 所 需要 的 处 理 对 象 并 
不 是 文件 中 的 某 个 字符 。 例 如 , 下 面 的 代码 可 以 删除 Document 中 的 第 n 行 : 


void erase_line(Document& d, int n) 

{ 

if (n<0 || d.line.size()<=nm) return; . /ignore out-of-range lines 
d.line.erase(advancel(d.line.begin(), n)); 
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函数 advance(n) 使 迁 代 器 向 前 移动 n 个 元 素 ; advance( ) 是 标准 库 中 的 隔 数 ,不 过 我 们 也 可 以 自己 
template<class Iter> lter advance(lter p, int n) 
while (n>0) { ++p; ——n; } I go forward 


return p; 
} 


注意 , 可 以 用 advance( ) 来 模拟 下 标 机 制 。 实 际 上 , 给 定 一 个 vector v, 那么 "advance(v. begin( )， 
n) 和 v[n] 大 体 上 是 一 样 的 。 之 所 以 说 是 “大 体 一 样 ”, 是 因为 advance( ) 会 使 迭代 器 一 个 元 素 一 个 
元 素 地 向 前 移动 , 直到 经 过 第 n -1 个 元 素 位 置 为 止 ; 而 vLn] 则 会 直接 把 迭代 器 指向 第 n 个 元 素 
的 位 置 。 

如 果 迭 代 器 对 向 前 移动 和 向 后 移动 都 支持 ， 比 如 list 的 迭代 器 , 那么 为 advance( ) 函数 传递 负 
的 参数 就 会 使 迭代 器 向 后 移动 。 而 对 支持 索引 的 迭代 器 , 标准 库 中 的 advance( ) 函数 会 直接 移动 
到 指定 的 位 置 ， 而 不 会 用 ++ 操作 符 一 步 一 步 地 移动 。 看 来 标准 库 中 的 advance( ) 函数 确实 比 我 们 
自己 定义 的 要 高 级 一 些 。 这 点 很 值得 注意 : 一 般 情 况 下 , 标准 库 中 定义 好 的 操作 会 更 仔细 地 对 性 
能 进行 考虑 , 所 以 还 是 优先 使 用 它们 吧 。 

试 一 试 ”重新 实现 advance( ) 函数 , 使 它 当 输入 负 的 参数 时 可 以 向 后 移动 。 

对 用 户 来 讲 , 查找 可 能 是 最 直观 的 一 种 迭代 了 。 我 们 会 查找 某 一 个 单词 (例如 milkshake 或 
Gavin ) , 某 一 个 不 能 被 看 做 词组 的 字符 序列 (例如 secret\nhomestead, 即 前 一 行 以 secret 结尾 , 而 后 
一 行 以 homestead 开始 ) 或 一 些 表达 式 ( 例 如 [bB] \w “ne, 即 表 示 以 大 写 或 小 写字 母 B 开头 , 后 接 0 
个 或 多 个 字母 ,以 ne 结尾 的 串 , 详 见 第 23 章 ) 等 。 下 面 我 们 看 看 如 何 来 处 理 第 二 种 情况 ; 在 Doc- 
ument 中 查找 某 一 给 定 的 字符 串 。 注 意 , 我 们 所 采用 的 算法 很 简单 , 但 不 是 最 优 的 ; 

。 在 文件 中 查找 字符 串 的 第 一 个 字符 。 

e 判断 该 字符 以 及 其 后 的 字符 是 不 是 我 们 所 要 的 字符 串 。 

。 如 果 是 , 则 结束 ; 否则 , 继续 查找 字符 串 的 第 一 个 字符 。 

我 们 采用 STL 的 方式 把 要 被 查找 的 文件 当做 由 一 对 和 迭代 器 定义 的 字符 序列 来 处 理 。 这 样 我 们 既 
可 以 对 文件 的 一 部 分 进行 查找 , 也 可 以 对 整个 文件 进行 查找 。 如 果 在 文件 中 找到 了 所 要 的 字符 串 ， 
那么 我 们 返回 一 个 指向 该 字符 串 第 一 个 字符 的 迭代 器 ; 否则 返回 一 个 指向 序列 末端 的 迭代 器 : 


Text_iterator find_txt(Text_iterator first, Text_iterator last, const string& s) 
{ 
if (s.size()==0) return last; // can'tfind an empty string 
char first_char = s[0]; 
while (true) { 
Text_iterator p = find (first, last,first_char); 
if (p==last || match(p,last,s)) return p; 
} 
} 


STL 中 一 般 用 返回 序列 的 末端 来 表示 “没有 找到 ”。match( ) 函数 非常 简单 , 它 只 是 对 两 个 字 
符 序列 进行 比较 。 你 可 以 试 着 自己 来 定义 它 , 用 来 在 字符 序列 中 查找 某 一 给 定 字 符 的 find( ) 函数 


可 能 是 标准 库 中 最 简单 的 算法 了 (参见 21.2 节 ) 。 可 以 按照 如 下 方式 使 用 find_txt( ) 函数 : 
Text _iterator p = 
find_txt(my_doc.begin(), my_doc.end(),"secreftnhomestead"); 
if (p==my_doc.end()) 
cout << "not found"; 
else { 
I do something 
} 
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我 们 的 文本 处 理 器 非常 简单 。 很 明显 , 我 们 注重 的 是 它 的 简单 性 和 高 效 性 ， 而 不 是 功能 的 复 
杂 性 。 但 不 要 认为 提供 有 效 的 插入 、 删 除 或 查找 操作 是 一 件 非常 简单 的 事情 。 我 们 通过 这 个 例子 
说 明了 SIL 序列 的 强大 和 通用 性 , 还 进一步 介绍 了 和 迭代 器 、 容 器 (比如 list 和 vector) 以 及 一 些 STL 
的 通常 做 法 (比如 用 返回 序列 的 末端 来 表示 操作 的 失败 )。 如 果 需 要 , 我 们 也 可 以 把 Document 定 
义 成 一 个 STL 容器 一 一 实际 上 完成 对 Text_iterator 的 定义 也 就 完成 了 其 中 的 一 大 部 分 工作 了 。 


20.7 vector、 list 和 string 


为 什么 对 行 用 list 而 对 字符 用 vector 呢 ? 更 进一步 讲 , 为 什么 要 用 list 处 理 行 的 序列 而 用 vec- 
tor 处 理 字符 序列 呢 ? 再 有 ,为 什么 不 用 string 来 存储 一 行 呢 ? 

我 们 可 以 把 问题 再 一 般 化 一 下 。 到 现在 为 止 , 我 们 知道 了 4 种 存储 字符 序列 的 方法 : 

。 char| ] (字符 数组 ) 

® Vector < char > 

® string 

® list<char> 

那么 给 定 一 个 具体 问题 后 , 我 们 应 该 如 何 选择 所 采用 的 存储 方式 呢 ? 当 问题 比较 简单 时 , 选 
择 哪 种 方式 都 无 所 谓 , 因为 它们 都 有 非常 相似 的 接口 。 比 如 , 给 定 一 个 iterator, 我 们 可 以 利用 ++ 


和 * 操作 符 来 对 字符 进行 访问 。 在 与 Document 相关 的 例子 中 , 我 们 可 以 很 容易 地 把 vector < char > 
换 成 list < char > 或 string。 这 使 我 们 可 以 根据 对 性 能 的 要 求 来 选择 具体 的 存储 方式 。 但 是 , 在 考 
虑 性 能 之 前 , 我 们 先 来 看 看 每 种 存储 方式 的 逻辑 特性 : 能 做 什么 和 不 能 做 什么 ? 
Elem[ ] : 不 知道 它 自己 的 大 小 。 没 有 begin( ) 、end( ) 这 样 的 容器 成 员 函 数 , 不 能 系统 地 实 
现 边界 检查 。 可 以 作为 参数 传递 给 用 C 或 C 风格 的 函数 。 其 中 的 元 素 在 内 存 中 被 连续 地 
存储 。 数 组 的 大 小 在 编译 时 就 确定 了 。 上 比较 ( == 和 != ) 和 输出 ( << Om 
数组 第 一 个 元 率 的 指针 。 
vector < Flem > : 基本 上 可 以 做 所 有 事 , 包括 insert( ) 和 erase( )。 支 持 索 引 。 支 持 像 insert( ) 
和 erase( ) 这 样 需要 移动 字符 的 列表 操作 ( 当 元 素 的 大 小 或 数目 很 大 时 效率 会 比较 低 ) 。 
支持 边界 检查 。 元 素 在 内 存 中 连续 存储 。vector 可 以 扩展 (例如 使 用 wi back( ) ) 。 回 
量 的 元 训 被 存储 为 数组 。 支持 对 元 素 进 行 比较 的 比较 操作 街 ( = <、<= 、> 和 
>= ) 。 
string: 提供 了 所 有 常用 的 操作 和 文本 处 理 操 作 , 例如 字符 串 的 连接 + 和 + =)。 其 中 的 
元 素 不 一 定 在 内 存 中 被 连续 存储 。string 可 以 扩展 。 支持 对 元 素 进 行 比较 的 比较 操作 符 

==、!=、<、<=、> 和 >=)。 
list < Elem > : 提供 了 除 索 引 外 所 有 常用 的 操作 。 我 们 可 以 在 不 移动 其 他 元 素 的 情况 下 
insert( ) 或 delete( ) 元 素 。 每 个 元 素 需 要 两 个 额外 的 字 ( 指 针 ) 来 存储 。list 可 以 扩展 支持 
对 元 素 进 行 比较 的 比较 操作 符 ( ==、!=、<、<=、> 和 >= )。 

正如 我 们 之 前 提 到 的 ( 见 17.2、18.5 节 )， 当 我 们 需要 和 底层 内 存 打 交道 或 需要 和 C 程序 打 
交道 时 数组 是 非常 有 用 且 必 需 的 ( 见 27.1.2 节 、27.5 节 )。 在 其 他 情况 下 , 由 于 vector 更 方便 灵 
活 , 常常 是 我 们 的 首选 。 a : 

试 一 试 上 述 的 区 别 在 实际 的 代码 中 意味 着 什么 ? 分 别 定 义 一 个 存 有 数据 “Helo” 
的 char、vector < char > 、list < char > 和 string,， 并 把 它们 作为 参数 传递 给 一 个 函数 。 该 函 
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数 首先 输出 其 中 的 数据 , 并 和 字符 串 “Hello" 相 比 较 ( 来 判断 你 是 否 真 的 在 它们 之 中 存储 
了 “Hello”) ,然后 再 和 字符 串 “Howdy” 比 较 , 看 看 它们 在 字典 中 谁 更 人 靠 前 。 把 参数 复制 
到 另 一 个 相同 类 型 的 变量 中 。 : 
试 一 试 重复 上 面 的 “ 试 一 试 ” 内容， 只 不 过 这 次 不 考虑 string， 并 把 所 存 的 数据 定 
义 为 1 2,3,4,5t; 
20.7.1 insert 和 erase 


标准 库 中 的 vector 是 我 们 使 用 容器 时 的 首选 。 它 几乎 支持 所 有 相关 的 操作 , 所 以 我 们 只 在 没 
有 办 法 时 才 会 使 用 其 他 的 替代 品 。vector 主要 的 问题 在 于 每 当 我 们 执行 msert( ) 或 erase( ) 这 样 的 
列表 操作 时 , 它 都 需要 对 元 素 进行 移动 。 当 vector 很 大 或 其 中 所 存储 的 元 素 很 大 时 这 会 大 大 降低 
代码 的 性 能 。 但 也 不 用 太 担 心 这 一 点 。 我 们 可 以 放心 地 用 push_back( ) 来 对 500 000 个 浮 点 型 数 
据 进行 读 取 。 毕 况 对 性 能 做 一 个 比较 精确 的 估计 是 一 件 不 太 容 易 的 事 。 

正如 在 20. 6 节 中 所 提 到 的 , 在 执行 insert( ) 、erase( ) 、push_back( ) 等 列表 操作 时 ,一 定 不 要 
使 迭代 器 或 指针 指向 vector 的 元 素 ， 因为 由 于 元 素 的 移动 , 这 会 使 迭代 器 或 指针 指 癌 错 误 的 位 置 ， 
这 也 正 是 list 优 于 vector 的 地 方 。 如 果 知 要 在 程序 中 指向 许多 数量 很 多 而 又 很 大 的 对 象 , 应 该 考 
虑 使 用 list。 

我 们 来 比较 一 下 list 和 vector 的 insert( ) 和 erase( ) 操作。 下 面 的 例子 可 以 很 好 地 说 明 问 题 : 


vector<int>::iterator p = vbegin(0; /take a vector 


++p; ++p; ++P; // point to its 4th element 
vector<int>: :iterator q = p; 


++q; // point to its Sth element 





p=v.insert(p,99);  //p points at the inserted element 
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现在 q 是 无 效 的 。vector 中 的 元 率 随 着 vector 大 小 的 增加 会 被 重新 配置 。 如 果 vector 没有 重新 分 
配 空间 的 话 ,q 应 该 指向 的 是 值 为 3 的 元 素 而 不 是 值 为 4 的 元 素 , 但 千 万 不 要 认为 一 定 会 是 这 样 。 


p = verase(p);  //p points at the element after the erased one 





不 过 q 变 成 无 效 的 了 。 但 是 , 在 这 两 次 操作 之 间 , 可 能 vector 中 所 有 的 元 素 都 被 重新 分 配 空间 了 。 
作为 对 比 , 我 们 使 用 list 来 完成 相同 的 操作 


list<int>::iterator B =vbegin0; /take a list 

++p; ++Pp; ++p; /point to its 4th element 
list<int>: :iterator q = p; 

++9; // pointto its 5th element 
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p = vinsert(p,99); /ppoints at the inserted element 





注意 , q 仍然 指向 取 值 为 4 的 元 素 。 


P=v.erase(p); /ppoints at the element after the erased one 
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同样 , 我 们 又 一 次 回 到 了 一 开始 的 情况 。 但 是 , 与 vector 的 不 同 之 处 在 于 , 我 们 不 会 移动 任 
何 元 素 , 而 且 q 始终 是 有 效 的 。 

list < char > 与 其 他 3 种 容器 相 比 需要 至 少 3 倍 的 存储 空间 一 一 在 PC 上 , 一 个 list < char > 需 
要 12 个 字 节 , 而 vector < char > 只 需要 1 个 字 节 。 当 字符 数 很 多 时 , 这 个 因素 必须 要 考虑 。 

那 什 么 时 候 能 体现 出 vector 比 string 好 的 地 方 呢 ? 从 它们 的 性 质 中 可 以 发 现 ，string 可 以 完成 
比 vector 更 多 的 功能 。 这 也 正 是 问题 的 所 在 : 由 于 string 可 以 完成 的 功能 太 多 , 对 它 进行 优化 就 变 
得 很 困难 了 。 实 际 上 ，vector 对 像 push_back( ) 这 样 的 内 存 操 作 确 实 是 进行 了 优化 的 ， 而 string 没 
有 。 取 而 代 之 的 是 ，string 对 复制 操作 、 对 处 理 短 的 字符 串 的 操作 以 及 对 与 C 风格 字符 捉 的 交互 
进行 了 优化 。 在 文本 编辑 器 的 例子 中 , 我 们 选择 vector 是 因为 我 们 需要 使 用 insert( ) 和 delete( ) ， 
这 也 是 出 于 性 能 的 考虑 。vector 和 string 在 逻辑 上 最 主要 的 区 别 在 于 vector 可 以 用 于 任何 类 型 的 元 
素 , 而 只 有 在 处 理 字 符 类 型 的 元 素 时 我 们 才 会 考虑 string。 简 而 言 之 , 只 有 当 需 要 进行 字符 串 操 作 
(例如 字符 串 连 接 等 ) 时 才 考 虑 使 用 string, 其 他 情况 下 , 就 用 vector 好 了 。 


20.8 调整 vector 类 达到 STL 版 本 的 功能 


我 们 在 20. 5 节 中 为 vector 加 入 了 begin( ) 、end( ) 和 typedef 操作 , 现在 只 需要 再 加 入 insert( ) 
和 erase( ) 操作 就 可 以 使 我 们 的 vector 基本 符合 std :: vector 的 要 求 了 : 


template<class T, class A = allocator<T> > class vector { 


int sz; // the size 
T* elem; /fa pointer to the elements 
int space; //number of elements plus number of free space “slots” 
A alloc; // use allocate to handie memory for elements 
public: 


1/.. .all the other stuff from Chapter 19 and §20.5... 
typedef T* iterator; // Elem* is the simplest possible iterator 


iterator insert(iterator p, const T& val); 
iterator erase(iterator p); 


}; 
我 们 还 是 使 用 指向 元 素 类 型 的 指针 T 作为 迭代 器 的 类 型 ,这 是 最 简单 的 方法 。 我 们 将 具有 边界 
检查 功能 的 迭代 器 的 实现 作为 练习 (参见 习题 18 ) 。 
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通常 情况 下 ， 人 们 不 会 对 数据 采用 连续 存储 的 数据 类 型 ( 比如 vector) 提供 列表 操作 ， 比 如 in- 
sert( ) 或 erase( ) 。 但 是 像 insert( ) 和 erase( ) 这 样 的 列表 操作 对 小 的 vector 是 非常 有 用 的 。 我 们 前 
面 已 经 了 解 了 push_back( ) 的 作用 , 它 其 实 也 是 一 个 列表 相关 的 操作 。 

我 们 可 以 通过 复制 所 有 位 于 所 删除 元 素 之 后 的 元 素来 实现 我 们 的 veetor <T> :: erase( )。 利 
用 19.3.6 节 中 的 vector 定义 ,我 们 得 到 


template<class T, class A> 
vector<T,A>::iterator vector<T,A>::erase(iterator p) 


{ 
if (p==end()) return p; 
for (iterator pos = p+1; pos!=end(); ++pos) 

*(pos-1) = *pos; // copy element “one position to the left” 
alloc.destroy(&*(end()-1); // destroy surplus copy of last element 
——5Z; 
return p; 

} 


下 图 可 以 很 好 地 帮助 我 们 理解 上 面 的 代码 : 





erase( ) 操作 的 代码 实现 很 简单 ,不 妨 在 纸 上 试 几 个 例子 。 有 没有 对 空 veetor 作 相 应 的 处 理 ? 为 什 
么 要 判断 p == end( )? 如 果 把 vector 的 最 后 一 个 元 素 删 除 会 怎么 样 ? 如 果 使 用 索引 来 表示 代码 的 
可 读 性 会 不 会 更 好 ? 

相对 而 言 ，vector <T，A > :: insert( ) 议 有 一 点 复杂 了 : 

template<class T, class A> 


vector<T,A>: :iterator vector<T,A>: ;insert(iterator p, const T& val) 
{ 
int index = p-begin(); 
if (size()==capacity()) reserve(size(}= =0?8: 2*size()); /make sure we 
1 have space 
1 first copy jast element into uninitialized space: 
alloc.construct(elem+sz,*back()); 
++5Z; 
iterator pp = begin()+index; / the place to put val 
for (iterator pos = end(0=-1; pos!=pp; ~—pos) 
*pos = *(pos—1); // copy elements one position to the right 
*(begin()+index) = val; A/ “insert” val 
return pp; 


} 
注意 : , 

-@ 由 于 迭代 器 不 能 指向 序列 之 外 ， 所 以 我 们 使 用 指针 来 完成 比如 elem + sz。- 这 就 是 为 什么 
配置 器 会 使 用 指针 进行 定义 而 不 用 迭代 器 。 

。 当 使 用 reserve( ) 时 , 元 素 会 被 移动 到 一 块 新 的 内 存 中 。 因 此 , 我 们 必须 要 记录 所 删除 元 素 
的 索引 值 而 不 是 指向 它 的 迭代 器 。 当 vector 重新 分 配 它 的 元 素 时 ，vector 的 迭代 器 会 失 
效 一 一 可 以 理解 为 它们 指向 的 是 旧 的 内 存 。 

。 使 用 A 作为 分 配器 的 参数 很 直观 , 但 不 准确 。 当 你 需要 实现 一 个 容器 时 ， 最 好 还 是 要 仔细 
阅读 一 下 相关 的 标准 。 
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。 我 们 会 尽量 不 去 和 底层 的 内 存 打 交道 。 标 准 库 中 的 vector( 包 括 标准 库 中 的 其 他 容器 ) 都 是 
根据 这 一 标准 而 实现 的 。 这 也 是 为 什么 我 们 应 该 尽量 使 用 标准 库 的 原因 。 
如 果 考 虑 性 能 的 因素 , 我 们 不 会 在 一 个 含有 100 000 个 元 素 的 vector 中 使 用 insert( ) 或 erase( )。 
在 这 种 情况 下 , 使 用 list (或 map, 参见 21.6 节 ) 更 为 合适 。 但 是 ，vector 中 确实 提供 了 insert( ) 和 
erase( ) 操 作 , 而 且 如 果 我 们 只 需要 移动 几 个 或 几 十 个 字 的 元 素 的 话 , 使 用 它们 还 是 没有 问题 的 一 一 
毕竟 现在 的 计算 机 已 经 比较 强大 了 (参见 习题 20) 。 注 意 不 要 在 很 少 的 小 元 素 上 使 用 list。 


20.9 调整 内 置 数组 达到 STL 版 本 的 功能 


我 们 之 前 总 是 在 不 停 地 重复 嵌入 数组 的 不 足 之 处 : 它们 一 不 小 心 就 会 转换 成 指针 , 它们 不 知 
道 自己 的 大 小 (参见 18. 5. 2 节 ) , 等 等 。 我 们 也 指出 了 它们 最 大 的 优点 : 它们 近乎 完美 地 利用 了 
物理 内 存 的 特性 。 

为 了 综合 二 者 之 长 , 我 们 可 以 创建 一 个 具有 数组 优点 而 没有 其 不 足 的 array 容器 ，array 容器 
在 一 份 技术 报告 中 被 引入 到 标准 中 。 由 于 并 不 要 求 在 所 有 实现 中 都 包含 技术 报告 中 所 定义 的 属 
性 , 在 你 所 使 用 的 实现 中 可 能 并 不 包含 aray。 但 是 , 它 的 思路 却 是 简单 而 有 用 的 : 


template <classT intN> /not quite the standard array 
struct array { 
typedef T value_type; 
typedef T* iterator; 
typedef T* const_iterator; 
typedef unsigned int size type; /the type of a subscript 


T elems[N]; 
// no explicit construct/copy/destroy needed 


iterator begin() { return elems; } 
const_iterator begin() const { return elems; } 
iterator end() { return elems+N; } 
const_iterator end(0 const { return elems+N; } 


size_type size() const; 


T& operator[](int n) { return elemsIn]; } 
const T& operatorl](int n) const { return elemsIn]; } 


const T& atlint n) const;  //range-checked access 
T& at(int n); // range-checked access 


T* data() { return elems; } 
const T * data() const { return elems; } 
}; 


上 面 给 出 的 这 个 定义 并 不 完整 ,也 不 完全 符合 标准 的 要 求 , 但 从 中 我 们 可 以 看 出 它 的 基本 思想 。 
如 果 你 所 使 用 的 实现 中 没有 包含 标准 array, 那 不 妨 就 把 它 当 做 array 的 定义 来 使 用 。 如 果 有 的 话 ， 
它 应 该 在 <,aray > 中 。 注 意 由 于 array <T, N >“ 知 道 ” 它 的 大 小 为 N, 我 们 可 以 提供 赋值 、 

!= 等 操作 , 就 像 vector 一 样 。 


举例 来 说 , 我 们 把 array 和 20. 4.2 节 中 的 high( ) 结 合 起 来 使 用 : 
void f() 

{ ; 
array<double,6> a = {0.0, 1.1, 2.2, 3.3, 4.4, 5.5 }; 
array<double,6>: :iterator p = high(a.begin() aend()); 
cout << "the highest value was " << *p << endl; 

} 
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注意 , 当 使 用 high( ) 时 , 我 们 并 没有 考虑 array。 之 所 以 可 以 在 array 中 使 用 hiah( )4 是 因为 这 三 者 
都 是 按照 标准 的 习惯 进行 定义 的 。 
20. 10 ”容器 概览 
STL 提供 了 一 些 容器 : 
标准 容器 
Vector 一 系列 空间 连续 的 元 素 ; 可 以 用 作 默 认 容 器 
list 一 个 双向 链表 ; 当 希 望 在 不 移动 现 有 元 素 的 情况 下 完成 对 元 素 的 插 人 和 删除 时 使 用 
deque 列表 和 向 量 的 结合 ; 除非 对 算法 和 计算 机 结构 非常 精通 ， 和 否则 不 要 使 用 它 
map 一 个 平衡 的 有 序 树 ; 当 需 要 实现 按 值 访问 元 素 时 使 用 (参见 21.6.1-~21.6.3 节 ) 
We 一 个 平衡 的 有 序 树 , 其 中 可 以 包含 同一 个 key 的 多 个 拷贝 ; 当 需 要 实现 按 值 访问 元 素 时 使 用 
i (参见 21.6.1 ~21.6.3 节 ) 
i 一 个 散 列表 ; 一 种 优化 的 map; 当 对 性 能 要 求 很 高 且 可 以 设计 出 较 好 的 散 列 函 数 时 使 用 
unordered_map 


unordered_multimap 


(21. 6.4 节 ) 


一 个 可 以 包含 同一 个 key 的 多 个 拷贝 的 散 列表 ; 一 种 优化 的 multimap; 当 对 性 能 要 求 很 高 且 可 
以 设计 出 较 好 的 散 列 函 数 时 使 用 (参见 21.6.4 节 ) 


set 一 个 平衡 的 有 序 树 ; 当 需 要 对 每 个 值 进行 跟踪 时 使 用 (参见 21. 6. 5 节 ) 

i 了 人 key 的 多 个 拷贝 的 平衡 的 有 序 树 ; 当 需 要 对 每 个 值 进 行 跟踪 时 使 用 (参见 
unordered_set 与 unordered_map 相似 , 但 只 有 value, 不 是 二 元 组 (key, value) 

unordered_multiset 与 unordered_multimap 相似 , 但 只 有 value, 不 是 二 元 组 (key, value) 

array 一 个 大 小 固定 的 数组 , 不 存在 媒人 数组 所 存在 的 大 部 分 问题 (参见 20.6 节 ) 


有 很 多 关于 这 些 容 器 及 其 使 用 的 其 他 资料 ( 书籍 或 网 上 资源 ) 。 下 面 给 出 一 些 比较 好 的 参考 


资料 : 


的 标 
多 样 
库 以 
感到 


Austern, Matt, ed. “Technical Report on C++ Standard Library Extensions” ISO/IEC PDTR 19768,. (Co- 
lloquially known as TR]1.) 

Austern, Matthew H. Genenic Programming and the STL. Addison-Wesley 1999. ISBN 0201309564. 

Koenig, Andrew, ed. The C++ Standard. Wiley 2003. ISBN 0470846747 (Not suitable for novices.) 

Lippman, Stanley B., Joste Lajoie, and Barbara E. Moo. The C++ Primer. Addison- Wesley, 2005. ISBN 0201721- 
481. (Use only the 4th edition.) 

Musser, David R., Gillmer J. Derge, and Atul Saini. STL Tutorial and Reference Guide: C++ Proeramming wi- 
th the Standard Template Library, Second Edition. Addison-Wesley, 2001. ISBN 0201379236. 

Stroustrup, Bjarne. The C++ Poeramming Language. Addison-Wesley, 2000. ISBN 0201700735. 

The documentation for the SGI implementation of the STL and the iostream library: www.sgi.com/tech/stl. 
Note that they also provide complete code. 

The documentation of the Dinkumware implementation of the standard library: www.dinkumware.com/manu- 
als/default.aspx. (Beware of several library versions.) 

The documentation of the Rogue Wave implementation of the standard library: www2.roguewave.com/suppo- 
rt/docs/index.cfm. | 四 


你 觉得 被 骗 了 吗 ? 你 觉得 我 们 应 该 对 所 有 的 容器 及 其 应 用 都 加 以 介绍 ? 这 是 不 可 能 的 。 相 关 
准 应 用 、 技 术 以 及 库 实在 是 太 多 了 , 你 不 可 能 一 下 就 全 部 掌握 。 程 序 设 计 是 一 门 非常 广阔 而 
的 技术 , 同时 也 是 一 门 高 雅 的 艺术 。 作 为 一 名 程序 员 , 你 需要 能 够 自己 找到 关于 语言 应 用 、 
及 相关 技术 的 信息 。 程 序 设 计 是 一 个 时 刻 变化 的 领域 , 所 以 如 果 你 对 自己 目前 所 掌握 的 技术 
满意 而 就 此 停止 , 那 你 很 快 就 会 变 得 落后 。“ 查找 相关 的 内 容 " 是 针对 许多 实际 问题 的 一 个 很 
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好 的 答案 , 而 且 随 着 你 所 掌握 技术 的 增加 , 它 会 变 得 越 来 越 重 要 。 
男 一 方面 , 你 会 发 现 当 你 对 vector、list 以 及 map( 见 21 章 ) 有 了 比较 深入 的 了 解 后 , 学 习 其 他 
STL 或 像 SIL 一 样 的 容器 的 使 用 会 变 得 非常 容易 ,你 还 会 发 现 其 他 非 STL 容器 及 其 应 用 也 会 变 得 
比较 容易 理解 了 。 
那么 什么 是 容器 呢 ? 在 上 面 给 出 的 所 有 参考 资料 中 你 都 可 以 找到 关于 STL 容器 的 定义 。 下 
面 我 们 只 给 出 它 的 概念 上 的 定义 。 一 个 STL 容 髓 


e 是 一 个 元 素 序 列 [ begin( ) :end( ) ) 。 
e 容 胡 的 操作 可 以 复制 元 宗 。 复 制 可 以 通过 赋值 或 拷贝 隧 数 来 实现 。 
。 可 以 确定 所 存 元 素 的 类 型 value -type。 
e。 有 迭代 器 iterator 和 const_iterator。 迭 代 器 提供 了 ”、++ (前 级 和 后 级 ) 以 及 != 操作 符 及 其 
相应 语法 。list 的 迭代 器 提供 了 可 以 在 序列 中 向 后 移动 的 -- 操作 , 它 也 叫做 双向 迭代 器 。 
vector 的 欠 代 器 提供 了 --、[j、+ 以 及 -操作 , 它 也 出 做 随机 访问 迭代 器 (参见 20. 10.1 
他)6 z 
e 提供 了 insert( ) 、 erase ( ) 、front( ) 、back( ) 、push_back( ) 、pop_back( ) 以 及 size( ) 等 操作 ， 
vector 和 map 还 提供 了 下 标 功 能 ( St | 和 
。 提供 了 对 元 素 进 行 比较 的 比较 操作 符 ( = \、<、<=、> 以 及 >= ) 。 容 器 采用 字典 顺 
序 对 < 、<= 、> 、>= 进行 处 理 ， 也 就 是 说 Rs 比较 。 
上 述 关 于 STL 容器 的 定义 可 以 让 你 了 解 容器 大 致 是 什么 。 详 细 的 内 容 请 参见 附录 B。 更 详细 
具体 的 内 容 可 以 参考 《The C++ Programming Language》 或 标准 。 
一 些 数据 类 型 提供 了 标准 容器 所 要 求 的 一 些 特性 , 但 不 是 全 部 。 我 们 称 之 为 “近似 容器 ”。 最 
常见 的 如 下 表 所 示 : 四 


“近似 容器 ” 

T[n] 内 置 数组 没有 size( ) 或 其 他 成 员 函 数 ; 当 可 以 使 用 vector、string 或 array 时 尽量 不 要 用 内 置 数组 

只 存储 字符 , 但 对 文本 处 理 提供 了 许多 有 用 的 操作 ， 比 如 字符 串 连 接 ( + 和 += ) ; 与 其 他 字符 
串 相 比 ， 尽量 使 用 标准 字符 串 

一 个 具有 向 量 操作 的 数学 向 量 ， 但 当 对 性 能 要 求 较 高 时 有 许多 制约 ， 只 有 当 需 要 进行 大 量 向 


量 计算 时 使 用 . 


另外 , 许多 个 人 与 组 织 都 天 力 于 符合 标准 容器 要 求 的 容 医 的 开发。 

如 果 不 太 确定 应 该 采用 什么 样 的 容器 , 就 用 vector。 除非 有 充分 的 理由 不 用 否则 就 用 vector。 
20. 10. 1 和 迭代 器 类 别 

在 我 们 之 前 的 讨论 中 , 似 平 所 有 的 迭代 器 都 是 可 以 通用 的 。 其 实 , 只 有 在 进行 简单 的 操作 时 
它们 才 是 通用 的 ， 比 如 对 某 个 序列 进行 一 次 遍历 并 读 取 其 中 的 数据 一 次 。 如 果 你 希望 完成 更 为 复 
杂 的 操作 , 例如 向 后 迭代 和 索引 , 你 就 会 需要 一 些 更 为 高 级 的 迭代 器 了 。 : 


迭代 器 类 别 ey 
输入 渤 代 医 。 可 以 利用 ++ 和 ?来 分 别 完成 交代 器 的 向 前 移动 和 元 过 值 的 读 取 。isream 提供 的 就 是 这 类 迁 代 
| 器 , 参见 21.7; 2 节 。 如 果 (*p). mm 有效, 则 可 以 简单 地 使 用 p ->m 
输出 迭代 器 可 以 利用 ++ 和 来 分 别 完成 选 代 器 的 向 前 移动 和 元 素 信 的 写 人 。 ostream 提供 的 就 是 这 类 和 迭 
2 . 代 器 , 参见 21.7.2 节 
向 前 迭代 器 可 以 利用 ++ 来 完成 迭代 器 的 多 次 向 前 移动 , 利用 * 来 完成 对 元 素 值 的 读 取 和 写 人 (除非 元 素 


是 const 的 ) 。 如 果 (*p). m 有 效 , 则 可 以 简单 地 使 用 p ->m 


从 这 些 提供 的 操作 中 可 以 看 出 , 每 当 使 用 输出 或 输 和 人 和 迭 
代 器 时 , 我 们 都 可 以 利用 向 前 迭代 器 来 完成 相同 的 功 
能 。 
器 也 是 一 种 双 办 迭代 器 。 和 迭代 器 的 类 别 可 以 表示 为 如 碳 
图 所 示 。 注 意 , 由 于 迭代 器 类 别 并 不 是 类 ,， 上述 层次 结 
构 并 不 是 采用 派生 实现 的 类 的 层次 结构 。 


3》 简单 练习 


全 一 


An 
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( 续 ) 
迄 代 器 类 别 
可 以 利用 ++ 来 完成 选 代 器 的 向 前 移动 ,利用 -- 来 完成 迁 代 器 的 向 后 移动 ,利用 * 来 完成 对 
双向 迁 代 器 元 索 值 的 读 取 和 写 和 人 (除非 元 索 是 const 的 ) 。list、map 和 set 所 提供 的 就 是 这 类 迭代 器 。 如 果 


( p).m 有 效 , 则 可 以 简单 地 使 用 p ->m 


可 以 利用 ++ 来 完成 迭代 器 的 向 前 移动 , 利用 -- 来 完成 迭代 器 的 向 后 移动 , 利用 * 或 [ ] 来 完 
成 对 元 素 值 的 读 取 和 写 入 (除非 元 素 是 const 的 ) 。 我 们 可 以 对 迭代 器 索引 , 并 利用 + 来 使 迭代 器 


随机 访问 迭代 天 加 上 一 个 整数 , 也 可 以 利用 ~- 来 使 迭代 器 减 去 一 个 整数 。 我 们 还 可 以 通过 对 两 个 指向 同一 个 序 


列 的 两 个 迭代 器 进行 减法 操作 来 判断 这 两 个 迭代 器 之 间 的 距离 。vector 提供 的 就 是 这 类 迭代 器 。 
如 果 ( “p).m 有 效 , 则 可 以 简单 地 使 用 p ->m 











双向 迭代 右 也 是 一 种 向 前 迭代 器 ,而 随机 访问 迭代 






i 


4 


oe 
pe 
NN ry 
和 i 于 :1 
k sy 人 
总 


.定义 一 个 含有 10 个 元 素 {10, 1, 2, 3, 4, 5, 6, 7, 8, 9| 的 int 型 数组 。 

.定义 一 个 含有 这 10 个 元 素 的 vector < int > 。 

. 定义 一 个 含有 这 10 个 元 素 的 list <int > 。 

. 另外 再 定义 一 个 数组 、 一 个 向 量 、 一 个 列表 , 并 分 别 把 它们 初始 化 为 上 面 所 定义 的 数组 、 向 量 和 列表 的 
拷贝 。 


.把 数组 中 的 每 个 元 素 值 加 2; 把 向 量 中 的 每 个 元 素 值 加 3; 把 列表 中 的 每 个 元 家 值 加 5。 


6. 编写 一 个 copy( ) 函数 ， 


template<class lterl, class lter2> iter2 copy(lter f1, lter1 e1, lter2 f2); 


该 操作 像 标 准 库 中 的 copy 函数 一 样 把 [fl , el ) 复制 到 [ 纪 , 他 + (el -fl))。 注意 ， 如 果 了 = =el, 那么 
该 序列 为 空 ， 此 时 不 需要 复制 任何 内 容 。 


. 使 用 上 面 所 定义 的 copy 函数 把 数组 中 的 内 容 复制 到 向 量 中 ,再 把 列表 中 的 内 容 复制 到 数组 中 。 
. 利用 标准 库 中 的 find( ) 函数 来 判断 向 量 中 是 否 含 有 元 素 3, 如 果 有 则 输出 它 的 位 置 ; 利用 find( ) 来 判断 列 


表 中 是 否 含 有 元 素 27, 如 果 有 则 输出 它 的 位 置 。 注 意 第 一 个 元 素 的 位 置 为 0, 第 二 个 元 素 的 位 置 为 1, 以 
此 类 推 。 如 果 find( ) 函数 返回 的 是 序列 的 末端 , 则 说 明 没有 找到 所 查 的 元 素 。 


>》 思考 是 


‘DD OO 7 Cn 二 - 


“为 什么 不 同人 编写 的 代码 看 起 来 会 不 一 样 ? 请 举例 说 明 。 
. 我 们 会 有 哪些 关于 数据 的 简单 问题 ? 

.存储 数据 有 哪些 不 同 的 方式 ? 

. 我 们 可 以 对 一 组 数据 做 哪些 基本 操作 ? 

. 关于 我 们 存储 数据 的 方法 有 什么 想法 ? 

.什么 是 STL 序列 ? 

. 什么 是 STL 迭代 器 ? 它 支持 哪些 操作 ? 

.如 何 把 迭代 器 移 到 下 一 个 元 素 ? 

.如何 把 迭代 器 移 到 上 一 个 元 素 ? 


10. 当 你 试图 把 迁 代 器 移动 到 序列 末端 之 后 时 会 出 现 什么 屋 况 ? 
11. 哪些 迭代 器 可 以 移动 到 上 一 个 元 素 ? 
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. 为 什么 要 把 数据 与 算法 分 离开 ? 

. 什么 是 STL? 

. 什么 是 链表 ? 它 和 向 量 本 质 上 的 区 别 是 什么 ? 
. 链表 中 的 “ 链 ” 是 什么 ? 

.insert( ) 的 功能 是 什么 ? erase( ) 呢 ? 

.如 何 判 断 一 个 序列 是 否 为 空 ? 

. list 中 的 迭代 器 提供 了 哪些 操作 ? 

.如 何在 SIL 容器 中 使 用 和 迭代 器 ? 

. 什么 时 候 应 该 使 用 string 而 不 是 vector? 
.什么 时 候 应 该 使 用 list 而 不 是 vector? 

. 什么 是 容器 ? 

.容器 中 的 begin( ) 和 end( ) 有 什么 用 ? 

， SIL 提供 了 哪些 容器 ? 

. 什么 是 迭代 器 的 种 类 ? STL 提供 了 哪些 迭代 器 ? 
6. 哪些 操作 随机 访 问 和 迭代 器 提供 了 而 双向 迭代 器 没有 提供 ? 


人 4 


算法 空 序列 序列 array 容器 


end( ) 单 链表 begin( ) erase( ) 
size_type 容器 insert( ) STL 
连续 的 和 迭代 typedef 双 辐 链表 
迭代 器 value_type 元 素 链表 

3》 习题 z 


10. 


如 果 觉 得 还 没有 完全 掌握 的 话 ,请 完成 本 章 中 所 有 的 “ 试 一 试 "练习 。 


， 运行 20.1. 2 节 中 的 例子 Jack-and-Jill。 利 用 几 个 小 文件 完成 输入 。 

. 仿照 18.6 节 中 回 文 的 例子 , 重新 编写 20. 1. 2 节 中 的 Jack-and-Jill 程序 。 
. 利用 STL 找到 并 修改 20. 3. 1 节 中 例子 Jack-and-Jil 中 的 错误 。 

.为 vector 定义 输入 和 输出 操作 符 ( >> 和 << ) 。 

. 根据 20. 6.2 节 中 的 内 容 , 为 Document 编写 一 个 查找 并 替换 操作 。 


查找 给 定 vector < string > 中 按 字典 顺序 最 后 的 一 个 下 付 昌 = Bs 


.编写 一 个 可 以 统计 Document 中 字符 总 数 的 函数 。 
.编写 一 个 可 以 统计 Document 中 字数 的 程序 。 该 程序 有 两 个 版 本 : 一 种 把 “ 字 ” 定义 为 “以 空格 分 隔 的 字符 
序列 ”, 另 一 种 把 “ 字 ” 定 义 为 “一 个 连续 的 数字 或 字母 序列 ”。 例 如 , 在 第 一 种 定义 下 ， 加 mumber 和 


asl2b 都 是 一 个 字 , 而 在 第 二 种 定义 下 它们 则 都 为 两 个 字 。 


编写 男 一 个 统计 字 的 程序 。 在 该 程序 中 , 用 户 可 以 自己 定义 所 采用 的 空白 字符 集合 。 
， 以 list < int > 为 参数 (引用 调用 ) , 创建 一 个 vector < double > , 并 把 列表 中 的 元 素 复制 到 向 量 中 。 验 证 复 


制 操作 的 完整 性 与 正确 性 。 然 后 把 元 素 按 照 升序 排序 并 打印 。 


.完成 20.4.1 节 中 关于 list 的 定义 并 运行 high( )。 设 置 一 个 Link 来 表示 末端 后 一 个 位 置 。 | 
. 实际 上 , 在 list 中 我 们 并 不 需要 一 个 指 加 末端 后 一 个 位 置 的 Link。 改 写 上 面 的 程序 , 用 0 来 代表 指向 末 


问 后 一 个 位 置 的 Link( list < Elem > :: end( ) ) ， 这 样 可 以 使 空 列表 的 大 小 和 一 个 指针 的 大 小 相 同 。 


. 采用 std :; list 的 方式 定义 一 个 单 向 链表 slist。 由 于 slist 中 没有 后 向 指针 ,list 中 的 哪些 操作 可 以 在 slist 


中 删 去 ? 


.定义 一 个 与 指针 vector 很 相似 的 pvector。 不 同 之 处 在 于 pvector 中 的 指针 指向 对 象 而 且 它 它 的 析 构 苯 数 


delete 会 删除 这 些 对 象 。 


.定义 一 个 与 pvector 很 相似 的 ovector。 不 同 之 处 在 于 ovector 中 的 [ ] 和 * 操作 符 返 加 的 是 一 个 由 元 素 ( 而 


不 是 指针 ) 所 指向 的 对 象 的 引用 。 

17. 定义 一 个 ownership_vector, 其 中 存储 的 是 指向 像 pvector 这 样 的 对 象 的 指针 。 用 户 可 以 自己 定义 该 vector 
所 指向 的 对 象 类 型 ( 例如 , 析 构 函数 delete 会 删除 哪些 对 象 ) 。 提 示 : 如 果 你 对 第 13 章 的 内 容 比较 熟悉 
的 话 就 会 觉得 这 道 题 比 较 容易 了 。 

18. 定义 一 个 vector 中 的 边界 检查 迭代 器 (随机 访问 和 迭代 器 ) 。 

19. 定义 一 个 list 中 的 边界 检查 迭代 器 (双向 迭代 器 ) 。 

20. 对 使 用 vector 和 list 的 时 间 消 耗 做 一 个 小 实验 。 有 关 如 何 对 程序 进行 计时 的 内 容 可 以 在 26. 6.1 节 中 找 


到 。 生 成 N 个 属于 区 间 [0:N) 的 int 型 随机 数 。 每 生成 一 个 随机 数 就 把 它 加 入 到 vector < int > 中 (该 vec- 
tor 大 小 每 次 加 1) 。 保 持 该 vector 为 有 序 的 , 也 就 是 说 , vector 中 新 元 素 之 前 的 所 有 元 素 都 小 于 等 于 新 元 
聚 的 值 ， 而 新 元 素 之 后 的 所 有 元 素 都 大 于 新 元 素 的 值 。 针 对 list < int > 完成 相同 的 操作 。 在 N 取 什么 样 
的 值 时 list 会 比 vector 快 ? 请 给 出 解释 说 明 。 该 实验 由 John Bentiey 最 先 提 出 。 


人 附 言 

假设 我 们 有 N 种 容器 和 相关 的 M 种 操作 , 那么 我 们 会 需要 N * M 段 代 码 。 如 果 所 处 理 的 数据 有 K 种 不 
同 的 类 型 ,那么 代码 段 的 总 数 就 会 达到 N* M* K。STL 通过 把 数据 类 型 作为 参数 (解决 了 因子 K 的 问题 ) 和 
把 算法 与 对 数据 的 访问 分 离开 解决 了 这 一 问题 。 通 过 利用 迭代 器 实现 对 不 同 容器 不 同 算法 中 数据 的 访问 ， 
我 们 只 需要 N+ M 种 算法 。 这 大 大 简化 了 我 们 的 工作 。 举 例 来 说 , 如 果 我 们 有 12 种 容器 和 60 种 算法 , 那么 
我 们 会 需要 720 个 函数 ; 而 STL 只 需要 60 个 函数 和 12 种 迭代 器 , 这 可 以 省 去 我 们 90% 的 工作 量 。 实 际 上 ， 
这 还 是 保守 估计 , 因为 很 多 算法 处 理 两 对 迭代 器 ,而 它们 不 必 是 相同 类 型 (参见 习题 6)。 而 且 , STL 还 提供 
了 可 以 很 简单 地 对 算法 代码 进行 编写 和 组 合 定 义 的 方法 , 这 会 使 我 们 的 工作 得 到 进一步 简化 。 
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“理论 上 ,实践 是 简单 的 。” | 
. -一 一 lygve Reenskaug 


本 章 将 完善 我 们 对 STL 基本 思想 以 及 STL 所 提供 工具 的 介绍 。 本 章 的 主要 目的 是 帮助 你 学 
习 一 些 最 有 用 的 STL 工具 , 它们 能 够 帮助 你 节约 大 量 的 代码 开发 时 间 。 我 们 将 通过 实例 的 方式 介 
绍 每 一 种 工具 的 用 途 以 及 它 所 采用 的 编程 技术 。 本 章 的 另 一 个 目的 是 提供 足够 的 工具 以 使 得 你 
能 够 根据 需要 编写 自己 的 不 同 于 标准 库 或 其 他 库 的 (优雅 和 有 效 的 ) 算 法 。 另 外 , 本 章 还 将 介绍 三 
种 容器 : map、set 和 unordered, map。 


21. 1 标准 库 中 的 算法 


标准 库 大 约 提供 了 60 种 有 用 的 算法 。 我 们 将 在 本 章 着 重 介绍 其 中 一 些 最 常用 的 算法 以 及 在 
某 些 场合 中 十 分 有 用 的 一 些 算法 ; 


r=find(b, e, vy) r 指向 在 [b:e) 中 v 首 次 出 现 的 位 置 

r=find_if(b, e, p) r 指向 在 [b:e) 中 使 得 p(x) == true 的 第 一 个 元 素 x 

x=count(b, e, v) x 为 v 在 [b:e) 中 出 现 的 次 数 

x=count_if(b, e, p) x 为 在 [b:e) 中 能 够 满足 条 件 p(x) == true 的 元 素 个 数 

sort( b, e) 通过 < 操作 符 对 [b:e) 排 序 

sort(b, e, p) 通过 p 对 [ b:e) 排 序 

copy(b, e, b2) 将 [b:e) 拷 贝 至 [b2:b2 +(e-b)); b2 之 后 应 有 足够 的 用 于 存储 元 素 的 空间 
unique_copy( b, e, b2) 将 [b:e) 找 贝 至 [b2:b2 + (e-b)); 算法 不 拷贝 相 邻 的 重复 元 素 

merge(b, e, b2, e2, 7) 将 有 序 序列 [b2:e2) 和 [b:e) 合 并 , 并 放 人 [r:r+(e-b) +(e2-b2) ) 之 中 
r=equal_range(b, e, v) r 是 有 序 范围 [b:e) 中 值 为 v 的 子 范围 , 本 质 上 , 就 是 对 v 的 二 分 搜索 
equal(b, e, b2) 判断 [b:e) 元 素 和 [b2:b2 + (e-b) ) 的 元 素 是 否 相等 

x=accumulate( b, e, i) x 是 将 i 与 [b:e) 中 所 有 元 家 进行 累加 的 结果 

x=accumulate(b, e, i, op) 与 accumulate 类 似 , 但 通过 op 进行 “ 求 和 ”运算 

x =inner_product( b, e, b2, i) x 是 [b:e) 与 [b2:b2 +(e-b)) 的 内 积 


x =inner_product(b, e, b2, i, op, op2) “与 inner_product 类 似 , 但 通过 op 和 op2 取代 内 积 的 + 和 * 操作 


默认 情况 下 ,相等 关系 通 过 == 操作 判断 , 而 排序 则 通过 < (小 于 ) 操 作 进 行 。 标 准 库 算法 在 
< algorithm > 头 文件 中 声明 。 如 果 读 者 想 获得 更 多 信息 ,， 请 参考 附录 B.5 和 20.7 节 中 的 资源 列 
表 。 这 些 算法 能 够 处 理 一 个 或 几 个 序列 。 一 个 输入 序列 由 一 对 迭代 器 定义 ; 一 个 输出 序列 由 一 个 
指向 首 元 素 的 迭代 器 定义 。 通 常 , 一 种 算法 可 以 由 一 个 或 多 个 操作 进行 参数 化 ,其 中 这 些 操 作 可 
以 是 函数 对 象 或 隐 数 。 这 些 算法 通常 会 通过 返回 输入 序列 的 结尾 作为 任务 “失败 ”的 报告 。 例 如 ， 
find(b, e, vy) 返 回 e， 如 果 它 未 找到 v。 


21.2 最 简单 的 算法 : find() 
find( ) 是 最 简单 但 十 分 有 用 的 一 种 算法 , 它 的 用 途 是 在 一 个 序列 中 查找 一 个 给 定 值 : 
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template<class In, class T> 
In find(In first, In last, const T& val) 
I find the first element in [first,last) that equals val 
{ 
While (frstl=last && *first != val) ++first; 
return first; 
} 


让 我 们 看 看 上 述 find( ) 的 定义 。 你 可 以 在 编程 中 使 用 find( ) 而 并 不 需要 了 解 它 的 具体 实现 一 — 实 
际 上 , 我 们 已 经 在 前 面 的 章节 中 使 用 过 find( ) 了 (例如 20.6.2 节 )。 尽 管 如 此 , find( ) 函数 的 定义 
包含 了 很 多 有 用 的 设计 思想 , 因此 了 解 它 的 实现 是 有 价值 的 。 


首先 , find( ) 对 由 一 对 迭代 器 定义 的 序列 进行 操作 。find( ) 函数 在 半 开 区 间 [ first:last) 中 查找 
给 定 值 val ， 而 函数 的 返回 结果 为 一 个 迭代 器。 返回 结果 要 人 么 指向 在 序列 中 val 首次 出 现 的 位 置 ， 
要 么 返回 last。 在 STL 中 , 返回 一 个 指向 序列 中 紧 接 末尾 元 素 之 后 位 置 的 迭代 器 通常 用 于 表示 “未 
找到 ”。 因 此 , 我 们 可 以 采用 如 下 方式 使 用 find( ) : 


void f(vector<int>& v, int x) 
{ 
vector<int>: :iterator p = find(v.begin(),v.end/(),»); 
if (pl=v.end()) { 
I we found x inv 


else { 
lnoxinv 


) 
Ws 
} 
在 上 面 的 例子 中 , 序列 由 一 个 容器 (STL vector) 所 包含 的 所 有 元 素 组 成 。 我 们 检查 返回 的 迭代 器 
是 和 否 指 向 序列 的 末端 ,以 判断 find( ) 是 否 找到 了 我 们 想 要 的 值 。 
到 目前 为 止 , 我 们 已 经 学 会 了 如 何 使 用 find( ), 从 而 也 了 解 了 如 何 使 用 那些 采用 相似 用 法 的 
算法 。 在 学 习 更 多 用 法 和 算法 之 前 , 让 我 们 再 进一步 观察 find( ) 的 定义 ， 
template<class In, class T> 
In find(In first, In last, const T& val) 
I/ find the first element in [first,last) that equals val 


while (first!=last && *first 1= val) ++first; 
return first; 
} 
当 你 第 一 次 看 这 段 代码 时 , 你 会 注意 代码 中 的 循环 吗 ? 这 一 循环 的 实现 实际 上 是 简洁 高 效 
的 , 且 它 是 表示 基本 算法 的 一 种 直接 方式 。 然 而 , 你 很 可 能 在 代码 中 不 会 注意 到 这 一 循环 。 现 


在 , 让 我 们 用 比较 常见 的 方式 重新 实现 find( ) 函数 , 并 对 这 两 种 实现 版 本 进行 比较 : 
template<class In, class T> 
In find(In first, in last, const T& val) 
I find the first element in [first,last) that equals val 


{ 
for (in p = first; p1=last; ++p) 
if (*p == val) return p; 
return last; 
} 而 


这 两 种 定义 在 逻辑 上 是 等 价 的 , 且 一 个 优秀 的 编译 器 能 够 为 这 两 种 定义 生成 相同 的 底层 代码 。 然 
而 , 在 现实 中 , 很 多 编译 器 都 不 具有 这 种 能 力 , 它们 无 法 消除 额外 的 变量 (p), 也 不 能 对 代码 进行 
重 排 以 使 所 有 的 条 件 测试 都 能 够 在 同一 个 位 置 被 执行 。 那 么 我 们 为 什么 要 担忧 和 进行 解释 呢 ? 
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一 部 分 原因 在 于 find( ) 的 第 一 种 (完美 的 ) 定 义 版 本 的 风格 已 变 得 十 分 流行 , 我 们 必须 学 会 它 以 阅 
读 其 他 用 户 的 代码 ; 另 一 部 分 原因 是 , 对 于 用 于 处 理 大 量 数据 的 、 短 小 且 被 频繁 使 用 的 函数 而 言 ， 
其 性 能 是 十 分 重要 的 。 
试 一 试 你 能 保证 上 述 两 种 定义 在 逻辑 上 是 等 价 的 吗 ? 你 是 如 何 保证 的 ? 试 着 提供 
证 据 证 明 二 者 是 等 价 的 。 然 后 , 通过 数据 测试 这 两 种 定义 。 著 名 的 计算 机 科学 家 (Don 
Knuth) 曾经 说 ,“ 我 只 是 证 明了 算法 的 正确 性 ,但 并 没有 对 它 进 行 测试 ”。 即 使 是 数学 证 
明 都 可 能 包含 错误 。 为 了 证 明 你 的 观点 ， 进 行 推理 和 测试 缺 一 不 可 。 
21. 2.1 一些 一 般 的 应 用 | 
find( ) 算 法 是 泛 型 的 、 通 用 的 。 这 意味 着 , 这 一 算法 能 够 被 用 于 不 同 的 数据 类 型 。 实 际 上 ， 
find( ) 算 法 的 通用 性 包括 两 个 方面 ; 它 能 用 于 : 
。 任何 STL 风格 的 序列 
。 任何 元 素 类 型 
下 面 是 一 些 例子 (如 果 你 感到 困惑 , 请 参考 20. 4 节 中 的 图 表 ): 
void f(vector<int>& v int x) // works for vector of int - 
vector<int>: :iterator p = find(v.begin(),v.end(),x); 
if (pl=v.end()) { /* we found x */} 
/ee 
} 
在 上 面 的 例子 中 , find( ) 使 用 了 vector < int > :: iterator 的 迭代 操作 ; 也 就 是 说 ，++ ( ++ first) 


只 是 将 指针 指向 内 存 中 的 下 一 个 位 置 (存储 了 vector 的 下 一 个 元 素 ) , 且 ” (在 "first 中 ) 对 该 指针 进 
行 解 引 用 。 和 迭代 器 之 间 的 比较 (在 first!= last 中 ) 是 指针 的 比较 ,， 且 对 迭代 器 的 取 值 进行 比较 (在 
“first!= val 中 ) 则 只 是 对 两 个 整数 进行 比较 。 
void fllist<string>& v string x) jworks for list of string 
list<string>: :iterator p = find(v.begin(),v.end(),x); 
if (pl=v.end()) {/* we found x */} 


// . .. 
} 


在 上 面 的 代码 中 , find( ) 使 用 了 vector < string > :: iterator 的 迭代 操作 。 这 个 例子 具有 与 上 面 
的 vector < int > 例子 相同 的 逻辑 。 尽 管 如 此 , 代码 具体 实现 是 不 同 的 ; 也 就 是 说 ，++ 操作 ( ++ 
first) 将 使 指针 顺 着 元 素 的 Link 指针 部 分 指向 list 下 一 元 素 的 存储 位 置 , 而 *( 在 “first 中 ) 操 作 将 获 
得 Link 的 数据 部 分 。 和 迭代 器 之 间 的 比较 (在 first!= last 中 ) 是 Link* 类 型 指针 的 比较 ， 而 对 迭代 器 
的 取 值 进行 比较 (在 ”first != val 中 ) 则 是 通过 string 类 型 的 != 操作 符 比 较 两 个 字符 串 。 

因此 , find( ) 函数 是 相当 灵活 的 : 只 要 遵循 了 迭代 器 的 规则 , 我 们 就 可 以 通过 find( ) 对 我 们 指 
定 的 序列 和 定义 的 容器 进行 查找 。 例 如 , 可 以 使 用 findt ) 在 Document( 人 参见 20.6 节 中 的 定义 ) 中 
查找 一 个 字符 : 


void f(Document& v char x) / works for Document of char 
{ 
Text_iterator p = find(v.begin(),v.end0,x); 
if (pl=v.endO) {/* wefoundx*%/}. 
/a 
这 种 类 型 的 灵活 性 是 STL 算法 的 特点 , 它 使 得 STL 算 法 具有 十 分 强大 的 功能 。 
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21.3 通用 搜索 算法 : find -fl() 


在 实际 中 ， 我 们 并 不 需要 经 常 查找 一 个 特定 值 。 更 常见 的 情况 是 ， 我 们 对 在 序 字 列 中 查找 符合 
某 些 标准 的 值 更 感 兴趣 。 如 果 我 们 能 够 在 查找 中 定义 自己 的 查找 标准 , 那么 我 们 就 能 够 得 到 一 个 
更 为 有 用 的 find 操作 。 例 如 , 我 们 也 许 希望 在 序列 中 查找 大 于 42 的 值 。 我 们 也 许 希望 在 不 考虑 
大 小 写 的 情况 下 比较 字符 串 。 我 们 也 许 希望 找到 序列 中 的 第 一 个 奇数 值 。 我 们 也 许 希 望 查找 一 
个 地 址 域 值 为 " 17 Cherry Tree Lane 的 记录 。 

根据 用 户 提 供 的 标准 进行 查找 的 标准 算法 是 find -让 1 


template<class In, class Pred> 

In find_if(In first tn last Pred pred) 

{ 本 | 
while (first!=last && 1pred(*first)) ++first; 
return first; | 


} 
显然 ( 当 你 对 源 代码 进行 比较 时 ) ,find_if( ) 的 实现 与 find( ) 的 实现 很 相似 , 除了 前 者 使 用 


! pred( “first) 而 非 first != val; 也 就 是 说 , 一 旦 谓词 pred( ) 成 立 , 则 find_if( ) 立 即 停止 查找 。 
谓词 是 一 种 返回 true 或 false 的 函数 。find _if( ) 要 求 谓词 具有 一 个 参数 ， 以 使 得 它 能 够 做 出 判 


斯 pred( first) 。 我 们 可 以 比较 容易 地 编写 一 个 谓词 以 检查 一 个 给 定 值 的 属性 , 例如 “给 定 字 符 串 
是 否 包 含 字母 x?”“ 给 定 值 是 否 大 于 42?”“ 给 定数 是 否 是 奇数 ?” 例 如 , 我们 可 以 通过 如 下 方式 在 
int 型 的 向 量 中 查找 第 一 个 奇数 : 
bool odd(int x) { return x%2; } //% is the modulo operator 
void f(vector<int>& v) . , 
{ 
vector<int>: :iterator p = find_if(v.begin(), v.end(), odd); 
if (p!l=v.end0) {/* we found an odd number */} 
1... 
} 
find_if( ) 对 每 一 元 素 调用 odd( ) 直至 它 找 到 了 第 一 个 奇数 。 注 意 , 当 你 将 一 个 隆 数 作为 参数 传递 
时 , 不 要 在 其 名 字 后 面 加 上 ()，, 否则 传递 的 将 不 是 函数 ,而 是 其 调用 结果 。 
类 似 地 ; 我 们 可 以 找到 一 个 列表 中 第 一 个 大 于 42 的 元 素 : 


bool larger_than_42(double x) { return x>42; } 


void flist<double>& v) 

{ 
list<double>: :iterator p = find_if(v.begin(), v.end(), larger_than_42); 
if (pl=v.end()) {/* we found a value > 42 */} 
il... 

} 


上 面 的 例子 并 不 是 十 分 令 人 满意 。 如 果 下 次 我 们 想 找 出 大 于 41 的 元 素 该 怎么 办 呢 ? 我 们 不 
得 不 编写 一 个 新 的 函数 。 那 查找 大 于 19 的 元 素 又 该 如 何 ?还 要 编写 另 一 个 函数 。 应 该 有 更 好 的 
方法 ! 

如 果 我 们 想 要 与 任意 的 值 v 进行 比较 , 我 们 需要 使 v 能 够 成 为 find_if( ) 谓词 的 一 个 隐 含 参 
数 。 我 们 可 以 编写 如 下 形式 的 代码 (选择 v_val 作为 变量 名 以 避免 与 其 他 名 称 发 生 冲突 ) : 


double v_val; /the value to which larger_than_v(} compares its argument 
bool larger_than_v(double x) {return x>v_val; } 


void f(list<double>& v, int x) 
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vval=31;  //setv_val to 31 for the next call of larger_than_v 
list<double>: :iterator p = find_if(v.begin(), vend(, larger_than_v); 
if (pl=v.end()) {/* we found a value > 31 */} 


Vv_val = x; //setv_val to x for the next call of larger_than_v 
list<double>: :iterator q = find_if(v.begin(), v.end(); larger_than_v); 
if (ql=v.end()) {/* we found a value > x*/} 


1... 
} z 
我 们 能 够 保证 上 述 代码 能 够 实现 我 们 想 要 的 功能 , 但 是 上 述 代码 维护 困难 。 再 次 地 , 我 们 认为 应 
该 还 有 更 好 的 方法 ! \ 
试 一 试 ”为 什么 我 们 不 愿意 按照 上 述 方式 使 用 v 呢 ? 给 出 由 上 述 方式 所 可 能 产生 的 
三 个 错误 。 列 出 三 个 你 特别 讨厌 出 现 上 述 错误 的 应 用 程序 。 


21. 4 ”应 数 对 象 


我 们 希望 能 够 向 find_if( ) 传递 谓词 ， 同 时 我 们 也 希望 谓词 能 够 将 元 素 与 以 参数 形式 传递 的 值 


进行 比较 。 特 别 地 , 我 们 希望 能 编写 如 下 形式 的 代码 : 
void f(list<double>& V int x) 


‘ 
list<double>: :iterator p = find_if(v.begin(), v.end(), Larger_than(31)); 
if (pl=v.end()) {/* we found a vajue > 31 */} 
list<double>: :iterator q = find_if(v.begin(), v.end(), Larger_than(x)); 
if (ql=v.end()) {/* we found a value > x */} 
Ms 

} 


显然 ，Larger_than 必须 满足 以 下 条 件 : 


”ee Larger_than 能 够 以 断言 的 形式 被 调用 , 例如 pred( first) 。 
e 能 够 存储 一 个 数值 , 例如 31 或 x, 供 被 调用 时 使 用 。 
为 了 满足 这 些 条 件 , 我 们 需要 “函数 对 象 ”， 即 一 种 能 够 实现 函数 功能 的 对 象 。 我 们 需要 对 象 


是 因为 对 象 能 够 存储 数据 , 例如 得 比较 的 值 。 例 如 ;: 
class Larger_than { 


int vy; 

public: 
Larger than(intvv) : v(vv) { } // store the argument 
bool operator()(int x) const { return x>v; } / compare 


}; 
有 趣 的 是 ， 上述 定义 能 够 使 上 面 的 例子 正常 工作 。 现 在 , 我 们 需要 指出 为 什么 这 一 定义 具有 这 样 
的 作用 。 对 于 Larger_than(31) , 它 代表 一 个 Larger :than 类 的 对 象 , 且 其 数据 成 员 v 的 取 值 为 31， 
例如 : 

find_if(v.begin(),v.end(),Larger_ than(31)) 
在 上 面 的 代码 中 , 我 们 将 对 象 Larger_than(31) 作 为 参数 pred 的 实 参 传递 给 find_if( ) 。 对 于 v 的 每 

一 个 元 率 , find_if( ) 调 用 : 
pred(*first) 


pred( first) 将 会 调用 我 们 的 函数 对 象 Larger_than(31 ) 的 调用 操作 符 ， 即 operator ( ) 。 因 此 ， 
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调用 的 结果 是 将 是 元 素 值 first 和 31 的 比较 结果 。 
在 这 里 , 我 们 发 现 上 述 陋 数 调 用 可 以 视 为 一 个 操作 符 “( ) 操 作 符 ”。“() 操 作 符 ” 也 称 为 函数 


调用 操作 符 和 应 用 操作 符 。 因 此 ,pred( first) 中 的 () 代 表 了 操作 符 Larger_than :: operator ( ) ， 就 
像 v[i] 中 的 下 标 代表 了 操作 符 vector :: operator[ | 一样 。 
21. 4. 1 范 数 对 象 的 抽象 视图 

我 们 已 经 学 习 了 一 种 机 制 , 这 一 机 制 允 许 一 个 “函数 "能够 承载" 它 所 要 的 数据 。 困 数 对 象 
为 我 们 提供 了 一 种 通用 的 、 强 大 的 、 便利 的 机 制 。 下 面 的 例子 展示 了 函数 对 象 的 更 一 般 性 的 

概念 : 
classF{ // abstract example of a function object 
$s; / state 

public: 

F(const S& ss) :s{(ss) { /* establish jnitial state */} 

T operator() (const S& ss) const 

{ 

/ do something with ss to s 


// return a value of type T (T is often void, bool, or 9) 


} 


const S& state() const { return s; } //reveal state 
void reset(const S& ss) {s=ss;} /reset state 
}; 


一 个 下 类 的 对 象 通过 其 成 员 s 存储 数据 。 根 据 需 要 , 一 个 函数 对 象 能 够 拥有 很 多 数据 成 员 。 当 一 
个 对 象 存储 了 数据 之 后 , 则 我 们 可 以 称 该 对 象 具有 了 “状态 ”。 当 构造 下 类 的 对 象 时 , 我 们 可 以 初 
始 化 其 状态 。 我 们 也 能 够 根据 需要 读 取 该 对 象 的 状态 。 对 于 下 类 , 我 们 实现 了 操作 state( ) 以 读 取 
F 类 对 象 的 状态 , 操作 reset( ) 以 设置 下 类 对 象 的 状态 。 然 而 , 当 设计 一 个 函数 对 象 时 , 我 们 能 够 
根据 自己 的 需要 实现 访问 对 象 状 态 的 方法 。 同 时 , 我 们 也 可 以 直接 或 间接 地 通过 普通 函数 调用 的 
概念 调用 函数 对 象 。 在 上 述 代码 中 , 我 们 将 下 在 被 调用 时 只 接收 一 个 参数 , 但 我 们 可 以 具有 多 个 
参数 的 函数 对 象 。 

函数 对 象 的 用 法 代表 了 STL 中 参数 化 的 主要 方法 。 我 们 可 以 通过 函数 对 象 指定 需要 查找 的 
对 象 (参见 21.3 节 ), 定义 排序 标准 (参见 21. 4.2 节 ), 在 数值 型 算法 中 指定 算术 操作 (参见 21.5 
节 ), 定义 值 相 等 的 含义 (参见 21. 8 节 ) 以 及 其 他 很 多 事情 。 函 数 对 象 的 使 用 是 灵活 性 和 一 般 性 的 
主要 来 源 。 

函数 对 象 通常 是 十 分 高 效 的 。 特 别 地 ,向 一 个 模板 函数 以 传 值 的 方式 传递 一 个 小 的 函数 对 象 
”能 够 带 来 性 能 的 优化 。 原 因 很 简单 , 但 对 于 只 熟悉 以 函数 为 参数 方式 传递 的 人 来 说 可 能 是 奇怪 
的 : 由 传递 函数 对 象 方式 所 产生 的 代码 要 比 由 传递 函数 方式 所 产生 的 代码 更 少 、 更 快 。 这 一 结论 
是 正确 的 , 仅 当 函数 对 象 较 小 (如 只 占 0、1 或 2 个 字 ) 或 者 函数 对 象 通过 引用 方式 传递 , 并 且 函 数 
调用 操作 符 的 操作 比较 简单 (如 简单 的 比较 操作 < ) ,同时 函数 对 象 以 内 联 的 形式 定义 (例如 , 函 
数 对 象 在 其 类 中 实现 所 有 定义 ) 。 在 本 章 中 (本 书 中 ) 的 大 多 数 例 子 的 函数 对 象 都 满足 这 些 条 件 。 
小 且 简单 的 函数 对 象 能 够 带 来 高 性 能 的 基本 原因 在 于 它们 保存 了 足够 的 类 型 信息 以 供 编译 器 产 
生 优 化 代码 。 甚 至 老式 编译 器 中 的 优化 器 都 能 够 为 Larger_than 中 的 比较 操作 产生 简单 的 表示 “大 
于 ”的 机 器 指令 , 但 它们 不 能 为 函数 调用 实现 这 一 优化 。 函 数 调 用 所 需 花费 的 时 间 通 常 是 执行 简 
单 比 较 操 作 所 花费 时 间 的 10 ~50 倍 。 另 外 ,函数 调用 所 形成 的 代码 通常 是 简单 比较 操作 所 形成 
的 代码 的 几 倍 。 
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21. 4. 2 ”类 成 员 上 的 谓词 
如 我 们 刚才 所 见 ， 标 准 算法 能 够 正确 处 理由 基本 类 型 的 元 素 组 成 的 序列 ,如 int 和 double。 然 
而 , 在 一 些 应 用 领域 , 类 对 象 的 容器 更 为 常见 。 下 面 是 一 个 根据 一 些 标准 对 记录 进行 排序 的 例子 : 


struct Record { 
string name; AH standard string for ease of use 
charaddr[24]; / old style to match database layout 
人 


} 

Vector<Record> vr; 

我 们 有 时 希望 能 够 根据 名 字 进 行 排序 ， 有 时 又 希望 能 够 根据 地 址 进行 排序 。 如 果 不 能 够 同时 
实现 这 两 种 排序 标准 , 那么 我 们 的 代码 很 可 能 会 没有 什么 实用 价值 。 幸 运 的 是 , 同时 实现 两 种 排 


序 标准 并 不 难 。 我 们 可 以 编写 如 下 代码 
1... 
sort(vr.begin(), vr.end(), Cmp_by_name()); //sort by name 
Ws 
St begin(), vr. ea, Cmp_by_addr()); jsort by addr 
1.. 


Gl _name 曙 数 对 象 根据 Record 的 name 成 员 对 两 个 Record 对 象 进行 排序 。Cmp_by_addr 函数 
对 象 根据 Record 的 addr 成 员 对 两 个 Record 对 象 进行 排序 。 为 了 使 用 户 能 够 指定 比较 标准 , 标准 
库 算 法 sort 采用 了 可 选 的 第 三 参数 以 供用 户 指定 比较 标准 。Cmp_by_name( ) 构 造 了 一 个 Cmp_by_ 
name 对 象 。 现 在 , 我 们 需要 和 定义 Cmp_by_name 和 Cmp_by_addr: 
/1/ different comparisons for Record objects: 
struct Cmp_by_name { 
bool operator(}(const Record& a, const Record& b) const 


{return a.name <b.name; } 


| 


struct Cmp_by_addr { 

bool operator((const Record& a, const Record& b) const 
{return strncmp(a.addr, b.addr, 24) <0;} NA!!! 

}; ; 


Cmp_by_name 类 的 实现 十 分 简单 。 函 数 调用 操作 符 ，operator ( ) ( ) 仅仅 通过 标准 string 的 < 操作 
符 对 name 字符 串 进 行 比 较 。 然 而 , Cmp_by_addr 中 的 比较 操作 实现 得 并 不 好 。 这 是 因为 采用 了 一 
种 较 差 的 方式 表示 地 址 : 由 24 个 字符 组 成 的 数组 ( 非 0 结尾 )。 之 所 以 采用 这 一 方式 , 一 部 分 原 
因 在 于 展示 函数 对 象 是 如 何 用 于 掩盖 丑陋 且 容 易 产 生 错误 的 代码 的 。 另 一 部 分 原因 是 这 一 特别 
的 表示 方式 曾 被 我 认为 是 一 个 挑战 :“ 一 个 不 能 通过 STL 处 理 的 丑陋 而 又 重要 的 现实 问题 ”实际 
上 , STL 能 够 处 理 。 比 较 函 数 使 用 了 标准 C( 和 C++ ) 库 函数 stmemp( ), 该 函数 能 够 对 固定 长 度 
ee、 并 且 当 第 二 个 “字符 串 " 在 字典 顺序 上 排 在 第 一 个 “字符 串 " 之 后 时 , 它 将 返 
一 -了 个 负数 (参考 附录 B. 10.3)。 


21.5 数值 算法 


大 多 数 的 标准 库 算 法 都 涉及 处 理 数据 管理 问题 ; 它们 需要 对 数据 进行 拷贝 、 排 序 、 查 找 等 。 
然而 ,只 有 少数 算法 涉及 数值 计算 。 当 我 们 需要 进行 计算 时 , 这 些 数 值 算法 就 变 得 十 分 重要 了 ， 
并 且 这 些 算法 为 我 们 在 STL 框架 中 编写 数值 算法 提供 了 启示 。 

在 STL 标准 库 中 只 有 4 种 数值 算法 : 
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数值 算法 
累加 序列 中 的 值 ; 例如 , 对 序列 |a, b, ce, dj 进行 a+b+c+d 计 算 。 续 果 x 的 类 
型 与 初始 值 i 的 类 型 一 致 
wi 沽 汐 将 两 个 序列 的 对 应 元 素 相 乘 并 将 结果 累加 。 例 如 , 对 序列 |a, by ec d| 和 |e, 1， 
nner_prod et | g,，h| 进 行 8*e+b#f+c*g+d*h 计 算 。 结果 x 的 类 型 与 初始 值 i 的 类 型 一 致 


对 一 个 序列 的 前 n 个 元 素 进 行 累加 , 并 根据 每 次 累加 的 结果 生成 一 个 序列 。 例 如 ， 
对 序列 |a, b, c,d| 进行 操作 将 生成 序列 la, a+b,a+b+c,a+b+c+dl 


i 对 一 个 序列 的 相 邻 元 素 进行 减 操作 ,并 根据 每 次 的 结果 生成 一 个 序列 。 例 如 ， 
对 序列 |a, b, ec, d| 进行 操作 将 生成 序列 |a, ba, c-b,d-cl 
这 些 算法 可 以 在 < numeric > 中 找到 。 我 们 将 介绍 前 两 个 , 如 果 有 需要 的 话 , 读者 可 以 自己 查 
找 后 两 个 的 详细 情况 。 
21.5.1 累积 
accumulate( ) 函数 是 最 简单 但 最 有 用 的 数值 算法 。 在 其 最 简单 的 形式 中 , 该 算法 将 序列 值 进 
行 累加 : 


template<class In, classT> Taccumulatelln first, in last, T init) 


x=accumulate(b, e, i) 


r=partial_ sum(b, e, r) 


{ 
while (first!=last) { 
init = init + *first; 
++firsts 
} 


return init; 


} J/ 
给 定 初始 值 init, 该 算法 将 序列 [first: last) 中 的 每 一 个 值 及 init 进行 累加 , 并 返回 所 得 累加 
值 。init 通常 称 为 累加 器 。 例 如 
inta0] = {1, 2, 3,4,5}; 
cout << accumulate(a, atsizeof(a)/sizeof(int), 0); 
上 述 代 码 的 打印 结果 为 15, 即 0+1+2+3+4+5。 显 然 , accumulate( ) 能 够 用 于 所 有 类 型 的 序列 ， 
void f(vector<double>& vd, int* p, int n) 


double sum = accumulate(vd.begin(), vd.end(), 0.0); 
int sum2 = accumulate(p,p+n,0); 


} 
稼 加 结果 的 类 型 与 accumulate( ) 中 累加 颖 的 类 型 一 致 。 这 一 灵活 性 是 十 分 重要 的 , 例如 : 
void flint* p, int n) 
{ 
int si =accumulate(p, p+n, 0); I sum into an int 
long sl=accumulate(p, p+n, long(0)); sumthe ints into a long 
double s2 = accumulate(p, p+n, 0.0); I sum the ints into a double 
} 


在 一 些 计算 机 系统 中 ,long 的 有 效 位 数 要 比 int 更 多 。 与 int 型 相 比 ，double 型 能 够 表示 的 数 
的 范围 更 大 , 但 可 能 精度 更 差 。 我 们 将 在 第 24 章 介 绍 在 数值 计算 中 范围 和 精度 所 起 的 作用 。 


将 用 于 存储 算法 的 最 终结 果 的 变量 作为 accumulate( ) 的 初始 值 是 一 种 比较 常见 的 用 法 : 
void f(vector<double>& vd, int* p, int nm) 
{ 

double s1 = 0; 

s1 =accumulate(vd.begin(), vd.end(), s1); 

int s2 = accumulate(vd.begin() vd.end(), s2);  //oops 

float s3 = 0; 

accumulate(vd.begin(), vd.end(), s3); I oops 
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我 们 应 该 记 住 初始 化 累加 器 以 及 使 用 变量 保存 accumujate( ) 的 结果 。 在 上 面 的 例子 中 ，s2 在 成 为 
accumulate( ) 初始 值 时 并 未 被 初始 化 ; 因此 算法 的 结果 是 不 可 预知 的 。 我 们 将 s3 传递 给 accumu- 
late( ) ( 传 值 方式 ,参见 8. 5.3 节 ) , 但 算法 结果 并 未 保存 ; 因此 , 算法 的 执行 只 会 造成 时 间 的 
21. 5.2 一 般 化 accumulate ( ) 


基本 的 accumulate( ) 具有 三 个 参数 。 然 而 , 在 实际 中 我 们 可 能 需要 使 用 其 他 有 用 的 操作 ( 例 
如 乘法 和 减法 ) 对 序列 进行 处 理 。 为 此 ,STL 还 提供 了 一 个 具有 4 个 参数 的 accumulate( ) 算法 ,在 
这 一 算法 中 我 们 能 够 指定 所 要 使 用 的 操作 : 


template<class In, class T, class BinOp> 
Taccumulate(in first In last, T init, BinOp op) 


while (firsti=last) { 
init = op(init, *first); 
++first; 

} 

return init; 


} 
任何 能 够 处 理 累 加 器 类 型 的 参数 的 二 元 操作 均 能 用 于 这 一 版 本 的 accumulate( ) 算 法 。 例 如 : 


array<doubie,4> a= {1.1, 2.2, 3.3, 4.4 }; /1 see $20.9 
cout << accumulate(a.begin(),a.end(, 1.0, multipiies<double>()); 


上 述 代码 将 打印 3$. 1384, 即 1.0*1.1*2.2*3.3*+4.4(1.0 为 初始 值 )。 代 码 中 的 二 元 操作 符 
multiplies < double > ( ) 是 一 个 实现 乘法 操作 的 标准 库 函 数 对 象 ; multiplies < double > 实现 double 数 
的 乘法 ; multiplies < int > 实现 int 数 的 乘法 , 等 等 。 还 有 一 些 其 他 的 二 元 限 数 对 象 : plus( 加 法 )、 
minus( 减法 ) 、divides 、modulus( 取 余 ) 。 这 些 对 象 均 在 <functional > 中 定义 (参见 附录 B. 6. 2)。 
注意 , 为 了 对 浮 点 数 进行 处 理 , 初始 值 设 为 1. 0。 
如 sort( ) 例子 (参见 21.4.2 节 ) 中 所 示 , 我 们 通常 对 类 对 象 中 包含 的 数据 更 感 兴趣 而 不 仅仅 
是 内 建 的 类 型 。 例 如 , 给 定 物品 的 单价 和 数量 , 我 们 可 以 计算 所 有 物品 的 价值 总 和 : 


struct Record { 
double unit_price; 
int units; // number of units sold 
ll... 


}; 
我 们 可 以 使 accumulate 的 操作 符 能 够 从 一 个 Record 元 素 中 抽取 units, 并 计算 价格 及 实现 累加 : 


double price(double v const Record& r) 


return v+ runit_price * runits; // calculate price and accumulate 


} 


void f(const vector<Record>& vr) 


double total = accumulate(vr.begin(), vr.end(), 0.0, price); 
Nd 
} 


我 们 在 这 里 使 用 了 函数 , 而 不 是 函数 对 象 一 我 们 这 么 做 仅仅 是 为 了 展示 。 当 下 面 两 个 条 件 之 一 
能 够 得 到 满足 时 , 那么 我 们 应 使 用 项 数 对 象 : 

。 如 果 函 数 对 象 需 要 在 调用 间 保 存 数值 , 或 

。 如 果 函 数 对 象 能 以 内 联 形 式 实 现 
根据 第 二 个 条 件 , 我 们 应 该 在 上 面 这 个 例子 中 选择 陋 数 对 象 的 方式 。 
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试 一 试 ”定义 一 个 vector < Record > 对 象 ， 用 你 所 选择 物品 的 4 个 记录 将 其 初始 化 ， 
并 通过 上 面 的 函数 计算 物品 的 总 价值 。 
21. 5. 3 内 积 
给 定 两 个 癌 量 ， We 这 一 操作 称 为 向 量 的 内 积 ， 内 
积 在 很 多 领域 都 十 分 有 用 (例如 , 物理 和 线性 代数 ; 参见 24.6 市 )。 下 面 是 SIL 版 本 的 内 积 
实现 : 
template<class In, ciass In2, class T> 


Tinner_product(in first, in last in2 first2, T init) 
// note: this is the way we multiply two vectors (yielding a scalar) 


{ 
while (first!=fast) { 
init = init + (*first) * (*first2); // multiply pairs of elements 
++first; 
++first2; 
} 
return init; 
} 


上 面 的 代码 能 用 于 任何 元 素 类 型 的 任何 序列 。 以 股票 市 场 指数 为 例 , 在 股票 市 场 中 , 每 一 个 上 市 
公司 都 会 被 分 配 一 个 “权重 ”。 例 如 , 在 道琼斯 工业 指数 中 ，Alcoa 公司 的 权重 为 2.4808。 为 了 获 
得 市 场 指数 , 我 们 需要 将 每 一 个 公司 的 股票 价值 与 其 权重 相 乘 ， 并 将 所 得 结果 进行 累加 。 显 然 ， 
这 里 需要 进行 价格 和 权重 之 间 的 内 积 操作 。 例 如 : 


/ calculate the Dow Jones Industrial index: 

vector<double> dow_price; /share price for each company 
dow_price.push_back(81.86); 

dow_price.push_back(34.69); 

dow_price.push_back(54.45); 

1... 


list<double> dow_weight; // weight in index for each company 
dow_weight.push_ 8549); 

dow_weight.push_back(2.4808); 

dow_weight.push_back(3.8940); 

Hh... 


double dji_index = inner_product( // multiply (weight,value) pairs and add 
dow_price.begin(), dow_price.end()， 
dow_weight.begin()， 
0.0); 
cout << "Djl value ” << dji_index << \n'; 
注意 ,inner_product( ) 需 要 处 理 两 个 序列 。 但 是 ，inner_product( ) 只 用 三 个 参数 对 这 两 个 序列 进行 
描述 : 参数 只 指出 了 第 二 个 序列 的 开始 位 置 。 这 一 算法 假设 第 二 个 序列 包含 的 元 素 个 数 要 等 于 或 
多 于 第 一 个 序列 。 如 果 这 一 假设 不 成 立 , 则 将 产生 错误 。 在 我 们 的 例子 中 , 这 一 假设 是 成 立 的 ; 
那些 "多余 的 ”元素 将 不 会 被 处 理 。 
两 个 序列 不 需要 具有 相同 的 类 型 , 且 序 列 元 素 的 类 型 也 不 必 相 同 。 为 了 说 明 这 一 点 , 我 们 使 
用 vector 存储 价格 而 采用 list 存储 权重 。 
21. 5.4 一 般 化 inner_product( ) 
inner_product( ) 也 可 以 像 accumulate( ) 一 样 具有 一 般 性, 但 i ) 需要 两 个 额 硕 外 的 参 
数 : 一 个 用 于 设置 累加 器 (与 accumulate( ) 一 样 ), 一 个 用 于 结合 元 素 的 值 对 : 
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template<class In, class In2, class T, class BinOp, class BinOp2 > 
Tinner_product(in first, in last, In2 first2, T init, BinOp op, BinOp2 op2) 


while(first!=last) { 
init = op(init, op2(*first, *first2)); 
++first; 
++first2; 


} 


return init; 


} 
在 21.6.3 节 中 , 我 们 将 回 到 道琼斯 的 例子 , 并 在 代码 中 使 用 这 种 inner_product( ) 形 式 。 


21.6 关联 容器 


除了 vector 之 外 , 最 有 用 的 标准 库容 器 恐怕 就 是 map。 每 个 map 是 一 个 (key, value) 对 的 有 序 
队列 , 使 用 它 你 可 以 基于 一 个 key 来 查找 一 个 value; 例如 my_phone_book[“ Nicholas" j 可 能 是 
Nicholas 的 电话 号 码 。 在 流行 的 竞争 中 ，map 唯一 的 潜在 竞争 对 手 是 unordered_map( 参 见 21. 6.4 
节 ) , 它 是 一 种 经 过 针对 字符 串 关键 字 优 化 过 的 map。map 和 unordered_map 有 很 多 相似 的 数据 结 
构 , 例如 关联 数组 、 散 列表 和 红 黑 树 等 。 流 行 的 和 有 用 的 概念 总 是 看 起 来 有 很 多 名 称 。 在 标准 库 
中 , 我 们 将 这 类 数据 结构 统称 为 关联 容器 。 

标准 库 提供 了 如 下 8 个 关联 容器 : 


关联 容器 

map (key, value) 对 的 有 序 容器 
set key 的 有 序 容器 | 
unordered_map (key，value) 对 的 无 序 容 器 
unordered_set key 的 无 序 容 器 

multimap key 可 以 出 现 多 次 的 map 
multiset key 可 以 出 现 多 次 的 set 


unordered_multimap key 可 以 出 现 多 次 的 unordered_map 
unordered_multiset key 可 以 出 现 多 次 的 unordered_set 


这 些 容 器 可 以 在 < map > 、< set > 、< unordered_map > 和 < unordered_set > 中 找到 。 
21. 6.1 映射 

思考 一 个 概念 上 简单 的 例子 : 建立 一 个 单词 在 文本 中 出 现 次 数 的 列表 。 最 明显 的 方式 是 维护 
一 个 我 们 看 到 单词 的 列表 , 我 们 看 到 每 个 单词 后 将 次 数 加 起 来 。 当 看 到 一 个 新 的 单词 时 , 我 们 首 
先 看 是 否 曾 经 看 到 过 它 ; 如 果 我 们 曾经 看 到 它 , 将 该 单词 相应 的 计数 需 加 1; 否则 , 将 它 插入 列表 
并 赋值 为 1。 我 们 可 以 使 用 列表 或 数组 来 完成 它 , 但 是 我 们 不 得 不 为 读 取 的 每 个 单词 进行 一 次 查 
找 。 这 个 过 程 可 能 是 缓慢 的 。 映 射 存储 关键 字 的 方式 使 得 查找 关键 字 是 否 存在 十 分 容易 ,因此 查 
找 部 分 在 我 们 的 任务 中 是 微不足道 的 : 


int main() 
{ 
map<string,int> words; //keep (word,frequency) pairs 


string s; 
while (cin>>s) ++words[s]; // note: words is subscripted by a string 


typedef map<string,int>: :const_iterator lter; 
for (lter p = words.begin(); pi!=words.end(); ++p) 
cout << p—>first <<": "<< p->second << \n'; 
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这 个 程序 中 有 趣 的 部 分 实际 是 ++ words[ s] 。 正 如 我 们 在 main( ) 第 一 行 中 看 到 的 ，words 是 一 个 
(string，int) 对 的 映射 ; 也 就 是 说 ,words 将 string 映射 到 int。 换 名 话说 , 如 果 我 们 得 到 一 个 string， 
words 可 以 让 我 们 访问 对 应 的 int。 当 我 们 用 string( 通 过 输入 得 到 单词 ) 来 标记 words 时 ,words[ sj 
是 一 个 将 int 对 应 于 s 的 引用 。 让 我 们 来 看 一 个 具体 的 例子 : 


wordsf"sultan7] 


如 果 我 们 没 看 到 过 字符 串 “sultan”,“sujtan ”将 会 以 默认 值 0 存 人 words。 现 在 , words 有 一 个 人 口 
(“sultan”, 0) 。 接 下 来 ,如 果 我 们 在 此 之 前 没有 看 到 “sultan”，++ words[“sultan” ] 会 将 值 1 与 字 
符 串 ”sultan 相关 联 。 详 细 来 说 : map 发 现 没 有 找到 “sultan”, 插入 一 个 (“sultan”, 0) 对 , 然后 ++ 
会 将 该 值 加 1, 得 到 1。 

我 们 现在 回来 看 这 个 程序 : ++wordsl sj 检测 每 个 输入 的 单词 , 并 将 它 对 应 的 值 加 1 Es 如 果 一 
个 新 的 单词 第 一 次 出 现 , 它 将 会 得 到 的 值 为 1。 现 在 , 这 个 循环 的 含义 是 清晰 的 : 


while (cin>>s) ++words[s]; 


这 个 程序 读 取 输入 的 每 个 单词 (用 空格 分 开 ), 并 计算 每 个 单词 的 出 现 次 数 。 现 在 我 们 要 做 
的 是 生成 输出 。 我 们 可 以 遍历 一 个 映射 ,就 像 其 他 STL 容器 一 样 。 每 个 map < string, int > 
的 元 素 是 < string，int > 值 对 。 每 个 值 对 的 第 一 个 元 素 是 first, 第 二 个 元 素 是 second, 因此 
输出 循环 为 


typedef map<string,int>: : const_iterator lter; 
for (lter p = words.begin(); pl!=words.end(); ++p) 
cout << p—>first << ": " << p->second << \n’; 


typedef( 参见 20.5 节 和 附录 A. 16) 只 是 为 了 表示 方便 和 具有 可 读 性 。 
为 了 进行 测试 , 我 们 可 以 将 第 一 个 版 本 的 《The C++ Programming Language》 第 1 版 的 开篇 加 
入 程序 : 


C++ is a general purpose programming language designed to make pro- 
gramming more enjoyable for the serious programmer. Except for minor 
details, C++ is a superset of the ©C programming language. In addition to 
the facilities provided by ©C, C++ provides flexible and efficient facilities 
for defining new types. 


我 们 得 到 输出 


C:1 

C++: 3 
C,:1 
Except: 1 
jn: 1 

a: 2 
addition: 1 
and: 1 

by: 1 
defining: 1 
designed: 1 
details,: 1 
efficient: 1 
enjoyable: 1 
facilities: 2 
flexible: 1 
for: 3 
general: 1 
is: 2 . 
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language: 1 
language.: 1 
make: 1 
minor: 1 

more: 1 

new:1 

of: 1 
programmer.: 1 
programming: 3 
provided: 1 
provides: 1 
purpose: 1 
serious: 1 
superset: 1 
the: 3 

to: 2 


types.: 1 
如 果 我 们 不 想 区 区 分 大 小 写字 母 或 删除 标 点 符号 , 我们 可 以 这 样 做 : 参见 练习 13。 
21. 6.2 map 概览 

那么 , 什么 是 映射 呢 ? 映射 的 实现 有 很 多 种 方式 , 但 是 STL 映射 的 实现 通常 是 平衡 二 叉 查 找 
树 , 更 具体 地 说 是 红 黑 树 。 我 们 将 不 会 深入 讨论 它 , 但 是 现在 你 知道 了 这 个 术语 。 这 样 , 如 果 你 
想 了 解 更 多 的 知识 , 你 可 以 通过 书籍 或 网 页 进行 查找 。 

一 标 树 是 由 多 个 节点 (与 列表 由 链接 构成 的 相似 ; 参见 20.4 节 ) 构成。 每 关上 
个 节点 保存 一 个 关键 字 , 它 有 相关 的 值 并 指向 两 个 子 节点 ,如 右 图 所 示 。 这 就 是 < 
map < Fruit，int > 在 内 存 中 的 样子 , 假设 我 们 插入 了 (Kiwi, 100)、( Quince, 0)、 ES 
(Plum, 8)、 (Apple, 7)、 (Grape, 2345) 和 (Orange, 99): 上 









ER a \ 
得 到 持 有 关键 字 的 值 为 first 的 节点 成 员 的 名 字 , 二 叉 查找 树 的 基本 规则 是 : 


left~>first<first && first<right—>first 
也 就 是 说 , 对 于 每 个 节点 ， 

® 它 的 左 子 节点 的 关键 字 小 于 节点 的 关键 字 , 并 且 

® 节点 的 关键 字 小 于 它 的 右 子 节点 的 关键 字 
你 可 以 对 书 中 的 每 个 节点 验证 这 个 规则 。 这 就 允许 我 们 从 树 根 查找 下 去 。 非 常 奇怪 的 是 , 在 计算 
机 科学 文献 中 , 树 是 从 它 的 根 向 下 生长 的 。 在 这 个 例子 中 , 根 节点 是 (Orange, 99)。 我 们 通过 比 
较 的 方式 向 下 查找 , 直到 找到 我 们 要 找 的 值 或 它 所 在 的 位 置 。 当 一 棵 树 的 每 棵 子 树 的 节点 数 与 到 
根 距离 相等 的 所 有 其 他 子 树 的 节点 数 大 致 相等 时 , 那么 这 棵 树 被 称 为 平衡 的 (就 像 上 面 的 例子 中 
那样 ) 。 平 衡 树 可 以 减少 到 达 每 个 节点 所 经 过 的 节点 数 。 

一 个 节点 可 能 会 保存 更 多 的 数据 , 映射 可 以 用 它 来 保持 树 中 节点 的 平衡 。 当 一 棵 树 中 的 每 个 
节点 的 左 、 右 子 树 的 节点 数 大 致 相同 时 , 这 棵 树 就 是 平衡 的 。 如 果 一 棵 有 N 个 节点 的 树 是 平 衔 
的 , 我 们 找到 每 个 节点 最 多 需要 查找 jog:(N) 个 节点 。 这 比 我 们 在 列表 中 从 开始 位 置 查找 一 个 关 
键 字 , 平均 要 查找 N/2 个 节点 的 情况 (线性 查找 时 最 坏 的 情况 是 查找 N 个 节点 ) 要 好 得 多 。( 见 
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21. 6.4 节 ) 例 如 , 我 们 看 看 一 个 非 平衡 的 树 ， 
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这 棵 树 仍然 遵守 每 个 节点 的 关键 字 大 于 它 的 左 子 节点 、 小 于 它 的 右 子 节点 的 规则 ; 
left->first<first && first<right->first 


但 是 , 这 个 版 本 的 树 是 非 平衡 的 , 因此 我 们 知道 经 过 三 “ 跳 " 到 达 Apple 和 Kiwi, 而 在 平衡 树 中 只 需 
要 经 过 两 " 跳 ” 。 对 于 有 很 多 节点 的 树 来 说 , 这 个 差别 是 很 明显 的 , 因此 用 于 实现 映射 的 树 是 平衡 的 。 
我 在 使 用 映射 时 并 不 需要 理解 树 。 这 里 只 是 做 个 合理 的 假设 , 那 就 是 专业 人 员 了 解 他 们 的 工 


具 的 基础 知识 。 我 们 需要 了 解 的 是 由 标准 库 提供 的 映射 的 接口 。 这 是 一 个 稍微 简化 过 的 版 本 : 
template<class Key, class Value, class Cmp = less<Key> > class map { 
Il 


}; 


typedef pair<Key,Value> value_type; //a map deals in (Key,Value) pairs 


typedef sometype] iterator; // probably a pointer to a tree node 
typedef sometype2 const_iterator; 


iterator begin(); I points to first element 
iterator end(); /I points one beyond the last element 


Value& operator[](const Key& k); //subscript with k 


iterator find(const Key& k); I/ is there an entry for k? 

void erasel(iterator p); I/ remove element pointed to by p 
pair<iterator, bool> insert(const value_type&); // insert a (key,value) pair 
Ms 


你 可 以 在 < map > 中 找到 真实 的 版 本 。 你 可 以 将 迭代 器 想象 成 一 个 Node”， 但 是 你 不 能 将 自 己 的 
实现 依赖 于 用 特定 类 型 来 实现 迁 代 器 。 
vector 和 list( 见 20. 5 节 和 附录 B.4) 的 接口 的 相似 性 是 明显 的 。 最 大 的 不 同 在 于 迭代 时 元 素 


是 成 对 的 , 其 类 型 为 pair < Key，Value > 。 这 个 类 型 是 男 一 个 有 用 的 STL 类 型 
template<class T1, class T2> struct pair { 


}; 


typedef T1 first_type; 
typedef T2 second_type; 
TI first; 

T2 second; 


pair() :first(T10), second(T2()) { } 
pair(const Ti& x, const T2& y) :first(x), second(y) { } 
template<class U, class V> 

pair(const pair<U,V>& p) :first(p.first), second(p.second) { } 


template<class T1, class T2> 
pair<T1,T2> make_pair(T1 x, T2 y) 
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{ 
return pair<T1,T2>(xy); 
} 


我 们 从 标准 库 中 复制 pair 的 完整 定义 及 其 有 用 的 辅助 函数 make_pair( ) 。 

注意 ， 当 你 对 一 个 映射 进行 迭代 时 , 元 素 将 按 关键 字 定 义 的 顺序 访问 。 例 如 ， 如果 对 例子 中 
的 水 果 进 行 迭代 , 我 们 将 得 到 : 

(Apple,7) (Grape,100) (Kiwi,2345) (Orange,99) (Plum,8) (Quince,0) 
我 们 插入 水 果 的 顺序 与 结果 并 不 匹配 。 

insert( ) 操 作 有 一 个 奇怪 的 返回 值 , 我 们 通常 在 简单 的 程序 中 忽略 它 。 它 是 对 (key，value) 元 
素 的 一 对 迭代 ,如果 调用 insert( ) 插 入 (key, value) 对 , 它 返 回 的 bool 为 tue。 如 果 关 键 字 已 经 在 
映射 中 存在 , 则 插入 失败 并 且 bool 为 false。 

注意 , 你 可 以 定义 映射 使 用 的 顺序 的 含义 , 可 以 通过 提供 第 三 个 参数 (Cmp 在 映射 声明 中 ) 来 
实现 。 例 如 : 

map<string, double, No_case> m; 
No_case 定义 不 区 分 大 小 写 的 比较 ; 见 21. 8 节 。less < Key > 定义 默认 的 顺序 是 小 于 。 
21. 6.3 另 一 个 map 实例 

为 了 更 好 地 体会 映射 的 用 途 , 我 们 返回 21. 5.3 节 中 的 道琼斯 的 例子 。 只 有 当 所 有 的 权重 出 
现在 vector 中 它们 对 应 的 名 字 的 位 置 , 这 段 代码 才 是 正确 的 。 它 是 隐 式 的 并 且 容 易 成 为 隐蔽 的 错 
误 的 来 源 。 这 里 有 很 多 办 法 可 以 解决 这 个 问题 , 最 有 吸引 力 的 办 法 是 使 权重 与 它 的 公司 代号 放 在 
一 起 , 例如 (“AA”, 2.4808 ) 。“ 代 号 "是 公司 名 称 的 缩写 ， 它 用 于 那些 需要 简洁 表示 的 情况 。 类 
似 地 , 我 们 可 以 将 公司 代号 与 它 的 股票 价格 放 在 一 起 , 例如 (“AA”, 34. 69)。 最 后 , 对 于 那些 无 
法 定期 访问 美国 股票 市 场 的 人 , 我 们 可 以 将 公司 代号 与 公司 名 称 放 在 一 起 , 例如 (“AA”,“ Alcoa 
Inc. ”) 。 也 就 是 说 , 我 们 可 以 保持 三 个 相关 值 的 映射 。 

首先 , 我 们 实现 (symbol，price) 映射 : 


map<string,double> dow _price; 
// Dow Jones Industrial index (symbol, price); 
// for up-to-date quotes see www.djindexes.com 
dow_price["MMM"] = 81.86; 
dow_price ["AA"] = 34.69; 
dow_price ["MO"] = 54.45; 
1... 


(symbol, weight) 映射 如 下 : 


map<string,double> dow_weight; / Dow (symbol,weight) 


dow_weight.insert(make_pair("MMM", 5.8549)); 
dow_weight.insert(make_ pair("AA",2.4808)); 
eae _pair("MO",3.8940)); 
1.. 


我 们 使 用 insert( ) 和 make_pair( ) 函数 ,以 显示 映射 中 的 元 素 实 际 是 成 对 的 。 i 了 符 
号 的 价值 ; 我 们 发 现 标记 符号 易于 读 取 ， 同样 重要 的 是 急于 书 与 。 
(symbol ，name ) 映射 如 下 : 


map<string,string> dow_name;  //Dow (symbol,name) 
dow_name["MMM"] = "3M Co."; 

dow_name[l"AA’"] = "Alcoa inc."; 

dow_name["MO"7] = "Altria Group Iinc."; 

We 
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通过 这 些 映 射 , 我 们 可 以 方便 地 提炼 出 各 种 信息 。 例 如 : 
double alcoa_price = dow_price ["AAA"]; // read values from a map 
double boeing_price = dow_price I"BA"]; . 


if (dow_price.find("INTC") {= dow_price.end()) //find an entry in a map 
cout << "intel is in the Dow\n'"; 


通过 映射 来 迭代 是 容易 的 。 我 们 只 需 记 住 关 键 字 称 为 frst， 而 值 称 为 second: 


typedef map<string,double>::const iterator Dow_iterator; 


// write price for each company in the Dow index: 
for (Dow _iterator p = dow_price.begin(); pli=dow_price.end(); ++p) { 
const string& symbol = p—>first; /the “ticker” symbol 
cout << symbol << '\t 
<<p->second << Ab 
<<dow_namelsymbol] << \n'; 


} , 
我 们 甚至 可 以 直接 使 用 映射 来 完成 某 些 计算 。 特 别 是 , 我 们 可 以 计算 出 索引 ， 就 像 我 们 在 21. 5.3 
节 中 所 做 的 那样 。 我 们 可 以 通过 各 自 的 映射 来 提取 股票 价格 和 权重 并 将 它们 相 乘 。 我 们 可 以 容 
易 地 编写 一 个 函数 ,以 便 对 任意 两 个 map < string，double > 完成 这 个 操作 : 


double weighted_value( 
const pair<string,double>& a, 
const pair<string,double>& b 
) /extract values and multiply 
{ 
return a.second * b.second; 


} 


现在 , 我 们 将 这 个 函数 加 入 inner_product( ) 的 通用 版 本 , 并 且 得 到 我 们 的 索引 的 值 : 


double dji_index = 
inner_product(dow_price.begin(0, dow_price.end(), / ali companies 
dow_weight.begin0， /their weights 


0.0, /initial value 

pius<double>()， /add (as usual) 

weighted_value); // extract values and weights 
// and multiply 


为 什么 有 人 将 这 类 数据 保存 在 映射 中 , 而 不 是 向 量 中 呢 ? 我 们 使 用 映射 在 不 同 的 值 之 间 建 立 联 
系 ,这 是 一 个 常见 的 原因 。 另 一 个 原因 是 映射 按 关 键 字 定义 的 顺序 来 保存 它 的 元 素 。 当 我 们 对 上 
面 的 dow 进行 迭代 时 , 我 们 按 字母 的 顺序 来 输出 符号 ; 如 果 我 们 使 用 向 量 , 则 需要 自己 进行 排序 。 
使 用 映射 的 最 常见 的 原因 是 基于 关键 字 查找 值 时 操作 简单 。 对 于 一 个 大 的 序列 来 说 , 使 用 find( ) 
来 查找 某 些 东西 的 速度 ， 比 在 排序 的 结构 ( 例如 映射 ) 中 查找 要 慢 得 多 。 
试 一 试 ”运行 这 个 小 例子 。 然 后 ， 添加 几 个 你 自己 选择 的 公司 ， 以 及 你 自己 选择 的 
权重 。 四 

21.6.4 unordered_ map 


为 了 在 一 个 向 量 中 找到 一 个 元 素 ， find( ) 需 要 检验 所 有 的 元 素 , 从 开始 到 正确 值 的 元 素 或 结 
尾 。 这 个 平均 代价 与 vector(N) 的 长 度 成 比例 ,我们 称 这 个 代价 为 O(N) 。 

为 了 在 映射 中 找到 一 个 元 素 , 下 标 操作 需要 检验 树 中 的 所 有 元 素 , 从 根 到 正确 值 的 元 素 或 
叶子 。 这 个 代价 平均 与 树 的 深度 成 比例 。 一 棵 有 N 个 节点 的 平衡 二 叉 树 的 最 大 深度 为 
log,(N) ; 代价 为 O(log,(N))。0(log,(N) ) 的 代价 与 log,(N) 成 比例 , 与 0(N) 相 比 实际 上 是 
非常 好 的 : 
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N 15 128 1 023 16 383 
log, (N) 4 7 10 14 


实际 的 代价 取决 于 我 们 以 多 快 的 速度 找到 这 个 值 ， 以 及 比较 和 迭代 的 人 代价。 通常, 追踪 指针 (在 
映射 中 查找 所 做 的 ) 比 增加 一 个 指针 (find( ) 在 向 量 中 所 做 的 ) 的 代价 大 。 

对 于 有 些 类 型 , 特别 是 整数 和 字符 串 , 我 们 可 以 做 得 比 映 射 的 树 查 找 更 好 。 我 们 不 讨论 细 
节 , 但 思路 是 获得 一 个 关键 字 , 我 们 计算 一 个 向 量 中 的 索引 。 这 个 索引 称 为 一 个 散 列 值 , 而 使 用 
这 种 技术 的 容器 通常 称 为 散 列 表 。 可 能 的 关键 字数 量 远 大 于 散 列 表 中 的 存储 位 置 数量 。 例 如 , 我 
们 经 常 使 用 散 列 函数 将 数 十 亿 个 可 能 的 字符 串 映 射 成 有 1000 个 元 紊 的 向 量 的 索引 。 这 可 能 有 些 
束 手 , 但 是 它 可 以 处 理 得 很 好 并 且 对 实现 大 的 映射 特别 有 用 。 散 列表 的 主要 优点 是 查找 的 平均 代 
价 接近 常数 0(1), 并 且 与 表 中 的 元 素数 量 无 关 。 很 明显 , 这 对 于 大 的 映射 来 说 是 很 大 的 优点 , 例 
如 一 个 有 500 000 个 Web 地 址 的 映射 。 如 果 要 获得 有 关 散 列 查找 的 更 多 知识 , 你 可 以 阅读 有 关 
unordered_map( 在 Web 中 ) 的 文档 , 或 者 有 关 数 据 结构 的 基础 文章 (查找 散 列 表 和 散 列 )。 

我 们 可 以 说 明 在 一 个 (未 排序 ) 向 量 、 一 个 平衡 二 又 树 和 一 个 散 列 表 中 如 何 进行 查找 , 如 下 图 所 示 : 

。 在 未 排序 向 量 中 的 查找 : 





。 在 映射 (平衡 二 又 树 ) 中 的 查找 : 





STL unordered_map 是 使 用 一 个 散 列 表 来 实现 的 , 正如 STL map 是 使 用 一 个 平衡 二 叉 树 ,而 STL 
vector 是 使 用 一 个 矩阵 来 实现 的 一 样 。STL 的 部 分 工具 用 于 将 所 有 数据 存储 和 访问 方式 与 通用 框 
架 和 算法 相 适 应 。 经 验 法 则 是 : 
。 除非 你 有 好 的 理由 ， 否则 应 应 该 使 用 vector。 
。 如 果 你 需要 基于 值 来 进行 查找 (而 且 你 的 关键 字 类 型 具有 合理 并 且 高 效 的 “小 于 ”操作 )， 
这 时 可 以 使 用 map。 
。 如 果 你 需要 在 一 个 大 的 映射 中 进行 大 量 查 找 , 并 且 你 不 需要 有 序 的 遍历 (以 及 是 否 可 以 为 
你 的 关键 字 类 型 找到 一 个 好 的 散 列 函 数 ), 这 时 可 以 使 用 unordered_map。 
在 这 里 , 我 们 不 会 描述 unordered_map 的 细节 。 我 们 可 以 将 unordered_map 与 string 或 int 类 型 的 关 
键 字 共同 使 用 , 就 像 使 用 map 一 样 ,除非 你 要 迭代 的 元 素 是 无 序 的 。 例 如 , 我 们 可 以 重新 编写 


21. 6. 3 节 中 的 道 琉 斯 例子 , 如 下 所 示 : 


unordered_map<string,double> dow_price; 
typedef unordered_map<string,double>::const_iterator Dow_iterator; 


for (Dow_iterator p = dow_price.begin(); p!=dow_price.end(); ++p) { 


久 21 复 擎 法 和 觅 身 461 


const string& symbol = p~>first; /the “ticker” symbol 
cout << Symbol << 全 
<<Pp->second << \t' 
<< dow_name[symbol] << \n'; 
} 


现在 , 在 dow 中 查找 的 速度 可 能 更 快 。 但 是 , 这 个 变化 并 不 会 很 显著 , 这 是 由 于 在 索引 中 只 有 30 
个 公司 。 是 否 已 经 保存 所 有 公司 在 纽约 股票 交易 所 的 价格 , 我 们 可 能 已 经 注意 到 性 能 上 的 不 同 。 
但 是 , 需要 注意 一 个 逻辑 上 的 不 同 : 迭代 得 到 的 输出 将 不 会 按 字母 顺序 排列 。 

非 排 序 的 映射 在 C++ 标准 文本 中 是 新 成 员 , 而 不 是 “第 一 类 成 员 ”, 因此 说 它 被 定义 在 技术 
报告 中 而 不 是 标准 中 更 恰当 。 它 们 被 广泛 使 用 , 虽然 你 很 少 看 到 它们 的 前 任 , 某 些 称 为 hash_map 
的 东西 。 

试 一 试 ”使 用 #include < unordered_map > 米 编 写 一 个 小 程序 。 如 果 它 没有 工作 , 说 

明 unordered_map 没有 被 你 的 C++ 实现 。 如 果 你 确实 需要 unordered_map, 你 需要 下 载 一 

个 可 用 的 实现 (例如 ， 参见 www. boost. org)。 

21.6.5 集合 

当 我 们 对 值 没 有 兴趣 时 ,可 以 将 集合 看 做 一 个 映射 ,或 看 做 一 个 没有 值 的 映射 。 我 们 可 以 用 
下 图 表示 一 个 集合 : | 
你 可 以 用 集合 表示 map 例子 ( 见 21. 6. 2 节 ) 中 的 水 果 ,， 如 下 图 所 示 : 


Setnode: &E 
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集合 什么 有 用 ? 如 果 我 们 看 见 一 个 值 ， 这 里 有 很 多 间 题 需要 我 们 记 住 。 跟踪 可 以 得 到 哪 种 水 时 
(与 价格 无 关 ) 是 一 个 例子 ; 构造 一 个 字典 是 另 一 个 例子 。 用 做 “记录 ”的 集合 具有 稍微 不 同 的 风 
格 ; 那 就 是 元 素 是 可 能 包含 “大量 ”信息 PA 4 需 使 用 一 个 成 员 作为 关键 字 。 例 如 : 


struct Fruit { 
string name; 
int count; 
double unit_price; 
Date last_sale_date; 
1 . . 





并 


struct Fruit_order { 
bool operatorOQ (const Fruit& a, const Fruit& b) const 
{ 
return a.name<b.name; 
} 
»; 


set<Fruit, Fruit_order> inventory; 


搂 下 来 ， 我 们 看 如 何 使 用 函数 对 象 来 显著 地 扩大 个 STL 组 件 适用 问题 的 范围。 

由 于 集合 没有 一 个 值 类 型 ， 因 此 它 也 不 支持 下 标 (operator[ ] ( ) ) 。 我 们 必须 使 用 “列表 操 
作 ”, 例如 insert( ) 和 erase( ) 。 不 幸 的 是 , 映射 和 集合 都 不 支持 push_back( ) 一 一 原因 很 明显 : 集 
合 不 是 由 程序 员 决 定 在 哪里 插入 新 值 , 而 需要 使 用 insert( ) 。 例 如 : z 
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inventory.insert(Fruit("quince",5)); 
inventory.insert(Fruit("apple", 200, 0.37)); 


集合 比 映 射 好 的 一 个 优点 是 你 可 以 直接 使 用 从 一 个 迄 代 得 到 的 值 。 由 于 这 里 没有 map( 见 
21. 6.3 节 ) 中 的 (key，value) 对 , 解 引 用 操作 可 以 得 到 元 素 类 型 的 值 : 


typedef set<Fruit>::const_iterator Si; 
for (Sil p = inventory.begin(), p!=inventory.end(0; ++p) cout << *p << \n'; 


当然 , 假设 你 已 经 为 Fmit 定义 了 << 。 
21.7 拷贝 操作 


在 21.2 节 中 , 我 们 认为 find() 是 "最 简单 的 有 用 的 算法 ”。 当 然 , 这 一 点 可 以 讨论 。 很 多 简 
单 的 算法 是 有 用 的 一 一 尽管 有 些 编写 起 来 有 些 繁琐 。 当 你 可 以 使 用 其 他 人 编写 和 调试 好 的 代码 
时 , 为 什么 要 编写 新 的 代码 ? 当 它 变 得 简单 和 有 效 时 ，copy( ) 将 会 给 find( ) 运 行 上 的 支持 。STL 
提供 三 个 版 本 的 拷贝 : 


拷贝 操作 
copy(b,e,b2) 将 [b: e) 拷贝 到 [ b2 : b2 +(e 一 b)) 
unique_copy(b,e,b2) 将 [b: e) 拷贝 到 [b2: b2 + (e-b)); 抑制 临近 的 拷贝 
copy_if(b,e,b2,p) 将 [b: e) 拷贝 到 [ b2: b2 + (e-b) ), 但 是 仅 对 满足 条 件 p 的 元 素 执 行 
21.7.1 拷贝 
基本 的 拷贝 算法 的 定义 如 下 : 
template<class ln, class Out> Out copy(ln first, In last, Out res) 
{ 
while (first!=last) { 
*res = *first; // copy element 
++res; 
++first; 
} 
return res; 
} 


给 定 一 对 迭代 器 ,copy( ) 将 它们 所 指定 的 序列 找 贝 到 由 男 一 个 迭代 器 指定 的 序列 中 (指向 此 序列 
第 一 个 元 素 ) 。 例 如 : 
void f(vector<double>& vd, list<int>& Ii) 
// copy the elements of a list of ints into a vector of doubles 
if (vd,size() < li.size()) error("target container too small"); 
copy(li.begin(), li.end(), vd.begin()); 
| Ws : 
注意 , copy( ) 的 输入 序列 类 型 可 以 与 输出 序列 类 型 不 同 。 这 是 对 STL 算法 的 有 效 概括 : 它们 可 以 
用 于 各 种 类 型 的 序列 , 而 无 须 对 实现 做 不 必要 的 假设 。 我 们 需要 记 住 检查 是 否 有 足够 的 空间 ,以 
供 输出 需要 保存 其 中 的 元 素 。 程 序 员 的 工作 是 检查 空间 的 大 小 。STL 算法 的 目标 是 最 大 的 通用 性 
和 最 佳 的 性 能 ; 它们 没有 做 范围 检查 和 其 他 保护 用 户 的 代价 昂 贯 的 测试 。 有 时 候 , 我 们 希望 由 它 
们 来 完成 , 但 是 当 你 想 进行 检测 时 ,你 可 以 像 我 们 所 做 的 那样 进行 检测 。 
21.7.2 流 和 迭代 妖 
你 可 能 听 到 过 短语 “拷贝 到 输出 ”和 “从 输入 拷贝 ”"。 那 是 对 某 种 形式 的 IO 的 有 用 的 思考 ， 
我 们 实际 上 可 以 像 那 样 使 用 找 贝 。 
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记 住 , 一 个 序列 是 

es 有 开始 和 结尾 

。 可 以 使 用 ++ 得 到 下 一 个 元 素 

。 可 以 使 用 “得 到 当前 元 素 的 值 

我 们 可 以 以 这 种 方式 容易 地 表示 输入 和 输出 流 。 例 如 : 
ostream_iterator<string> 00(cout); /assigning to *oo is to write to cout 
*o0 = "Hello, "; 1 meaning cout << "Hello, " 


++00; 1 “get ready for next output operation” 
*00 = "Worldin" “ //meaning cout << "World\n" 
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你 可 以 想象 如 何 来 实现 它 。 标 准 库 中 提供 了 一 个 ostream_iterator 类 型 ，ostream_iterator <T> 是 一 


个 和 迭代 器 , 你 可 以 用 它 写 人 类 型 的 值 。 
与 此 类 似 , 标准 库 中 提供 了 一 个 istream_iterator <T > , 你 可 以 用 它 读 取 类 型 T 的 值 : 
istream_iterator<string> ii(cin); / reading *ii is to read a string from cin 
string s1 = *ii; I// meaning cin>>s1 


十 十 证 ; // “get ready for the next input operationm” 
string s2 = *ii; I meaning cin>>s2 


通过 ostream_iterator 和 istream_iterator, 我 们 可 以 为 自己 的 VO 使 用 copy( ) 。 例 如 , 我 们 可 以 实现 


一 个 “粗制滥造 的 "字典 , 如 下 所 示 : 


int main() 

{ 
string from, to; 
cin >> from >> to; I/ get source and target file names 
ifstream is(from.c_str()); // open input stream 
ofstream os(to.c_str()); I/ open output stream 
istream_iterator<string> ii(is); /I make input iterator for stream 
istream_iterator<string> eo0s; I/ input sentinel 
ostream_iterator<string> 00(0s,"\n"); // make output iterator for stream 
vector<string> b(ii,eos); I b is a vector initialized from input 
sort(b.begin() ,b.end/()); I sort the buffer 
copy(b.begin() ,b.end() ,00); 由 copy buffer to output 


} 


迭代 器 eos 是 流 迭 代 器 中 对 “输入 结束 ”的 表示 。 当 一 个 istream 到 达 输 入 结束 (经 常 被 表示 为 


eof) , 它 的 流 迭 代 器 相当 于 默认 的 流 迭代 器 (这 里 称 为 eos) 。 


注意 , 我 们 使 用 一 对 迭代 器 来 初始 化 向 量 。 由 于 是 对 一 个 容器 的 初始 化 ,一 对 迭代 器 (a, b) 
不 “将 序列 [a: b) 读 取 到 容器 ”。 显 然 , 我 们 使 用 的 一 对 迭代 器 是 (ii，eos) 一 一 输入 的 开始 与 结 


东 。 这 使 我 们 不 需要 使 用 >> 和 push_back( ) 。 我 们 强烈 建议 不 需要 选择 
Vector<string> b(max_size); 1 don't guess about the amount of inputl 
copylii,eos,b.begin()); 


那些 试图 猜测 输入 的 绝 大 多 数 人 , 通常 会 发 现 他 们 低估 了 输入 规模 ,并 遇 到 了 严重 的 问题 , 对 于 


他 们 和 他 们 的 用 户 , 那 就 是 从 结果 缓冲 区 中 溢出 。 这 种 溢出 也 是 安全 问题 的 一 种 来 源 。 


试 一 试 首先， 编写 程序 并 用 一 个 小 的 文件 来 测试 , 这 个 文件 中 包含 几 百 个 单词 。 
然后 ,尝试 一 下 强烈 不 推荐 的 版 本 ,猜测 输入 的 数量 并 看 当 输 入 缓冲 区 上 溢出 时 会 发 上 生 
什么 。 注 意 , 最 坏 的 情况 是 在 具体 的 例子 中 , 洲 出 没有 导致 任何 错误 , 这 样 你 可 以 将 它 


464 。 萝 三 部 分 “发 据 结 欧 和 算法 


推荐 给 用 户 。 
在 我 们 的 小 程序 中 , 我 们 读 取 单词 然后 进行 排序 。 这 在 当时 看 来 是 一 个 明显 的 方式 , 但 是 我 们 为 
什么 要 将 单词 放 在 “错误 的 位 置 ”, 以 至 于 随后 我 们 不 得 不 进行 排序 ?更 糟糕 的 是 , 我 们 发 现 由 于 
一 个 单词 出 现在 输入 中 , 我 们 会 多 次 保存 和 打印 这 个 单词 。 

我 们 可 以 通过 用 unique_copy( ) 代替 copy( ) 来 解决 后 一 个 问题 。unique_copy( ) 不 会 重复 拷贝 
相同 的 值 。 例 如 ,如 果 使 用 copy( ) , 程序 输入 
the man bit the dog 
并 且 生 成 

bit 

dog 

man 


the 
the 


如 果 我 们 使 用 unique_copy( ) , 程序 将 会 输出 
bit 
dog 
man 
the 


这 些 新 行 从 哪里 来 ? 带 有 分 隔 符 的 输出 是 很 常见 的 ，ostream_iterator 的 构造 函数 允许 你 (可 选 的 ) 
指定 在 每 个 值 之 后 打印 一 个 字符 串 : 

ostream_iterator<string> o0(0s,"\n"); // make output iterator for stream 
很 明显 , 输出 一 个 新 行 是 适 于 人 类 阅读 的 流行 选择 , 但 是 我 们 可 能 愿意 使 用 空格 作为 分 隔 符 , 我 
们 可 以 这 样 写 

Ostream_iterator<string> 00(0s," "); /make output iterator for stream 
这 时 将 会 得 到 输出 

bit dog man the 
21.7.3 使 用 集合 保持 顺序 

这 里 有 一 个 更 容易 的 方式 来 得 到 输出 ; 那 就 是 使 用 集合 而 不 是 使 用 向 量 : 


int main() 

{ 
string from, to; 
cin >> from >> to; // get source and target file names 
ifstream is(from.c_str()); // make input stream 
ofstream os(to.c_str()); /make output stream 
istream_iteratorc<string> ii(is); // make input iterator for stream 
istream_iterator<string> eos; /input sentinel 
ostream_iterator<string> 00(os," "); ‘// make output iterator for stream 
set<string> bl(ii,eos); lb is a set initialized from input 
copy(b.begin() ,b.end() ,00); // copy buffer to output 

} 


当 我 们 将 值 插入 一 个 集合 时 , 重复 的 值 被 忽略 掉 。 另 外 , 集合 中 的 元 素 是 保持 顺序 排列 的 , 因此 
不 需要 进行 排序 。 通 过 使 用 正确 的 工具 , 大 多 数 任务 容易 完成 。 
21.7.4 copy_if 


copy( ) 算 法 会 无 条 件 完 成 拨 贝 。unique._ cpy() 算 法 会 限制 值 相同 的 相 邻 元 素 。 第 三 种 拷贝 
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算法 只 拷贝 满足 条 件 的 元 素 : 
template<class In, class Out, class Pred> 
Out copy_if(ln first, In last, Out res, Pred p) 
/ copy elements that fulfiil the predicate 
{ 
while (first!=last) { 
if (p(*first)) *res++ = *first; 
十 十 first; 


} 


return res; 
} 
使 用 21. 4 节 中 的 Larger_than 函数 对 象 ,我们 可 以 找到 一 个 序列 中 大 于 6 的 所 有 元 素 , 如 下 所 示 : 


void f(const vector<int>& v) 
// copy all elements with a value jarger than 6 
{ 
vector<int> v2(v.size()); 
copy_if(v.begin(), v.end(), v2.begin(), Larger_than(6)); 
A sa 
} 


由 于 编程 时 出 现 的 一 个 错误 , 这 个 算法 错过 了 1998 年 的 ISO 标准 。 这 个 错误 现在 已 经 修改 了 , 但 
是 你 仍然 可 以 找到 没有 copy-if 的 实现 。 如 果 是 这 样 , 请 使 用 本 节 中 的 定义 。 


21. 8 排序 和 搜索 


我 们 经 常 希望 日 己 的 数据 是 有 序 的 。 我 们 可 以 通过 使 用 一 个 数据 结构 , 例如 映射 或 集合 , 或 
通过 排序 来 保持 顺序 。 在 STL 中 , 最 常见 和 有 用 的 排序 操作 是 sort( ) , 我 们 已 经 使 用 过 几 次 。 在 
默认 情况 下 ,sort( ) 使 用 < 作为 排序 规则 , 但 是 我 们 也 可 以 使 用 自己 的 规则 : 


template<class Ran> void sort(Ran first, Ran last); 
template<class Ran, class Cmp> void sort(Ran first, Ran last, Cmp cmp); 


作为 一 个 基于 用 户 特定 规则 排序 的 例子 , 我 们 将 介绍 如 何 进 行 字符 串 排 序 (不 考虑 特例 ) : 


struct No_case{ /is lowercase(x)<lowercase(y)? 
bool operator()(const string& x, const string& y) const 


{ 
for (int i = 0; i<x.length(); ++i) { 
if (i == y.length()) return false; //y<x 
char xx = tolower(x[i]); 
char yy = tolower(y[i); 
if (xx<yy) return true; // x<y 
if (yy<xx) return false; ly<x 
} 
if (x.length()==y.length()) return false; //x==y 
return true; / x<y (fewer characters in x) 
} 


}; 


void sort_and_print(vector<string>& vc) 
{ 


sort(vc.begin(),vc.end(0),No_case()); 


for (vector<string>::const_iterator p = vc.begin(0); pi=vc.end(); ++p) 
cout << *p << \n'; 


} 
如 果 一 个 序列 是 有 序 的 , 我 们 不 需要 用 find( ) 从 开始 位 置 查找 ; 我 们 可 以 利用 顺序 进行 一 次 二 分 
查找 。 二 分 查找 的 工作 如 下 : 
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假设 我 们 在 查找 值 x; 查看 中 间 元 素 : 
。 如 果 元 素 的 值 等 于 x, 我 们 已 经 找 它 ! : 
。 如 果 元 素 的 值 小 于 x, 包含 值 x 的 元 素 位 于 右边 , 因此 我 们 要 查找 右 半 部 分 (在 这 半 部 分 进 
行 二 分 查找 ) 。 
。 如 果 元 素 的 值 大 于 x, 包含 值 x 的 元 素 位 于 左边 , 因此 我 们 要 查找 左 半 部 分 (在 这 半 部 分 进 
行 二 分 查找 ) 。 
。 如 果 我 们 已 经 到 达 最 后 一 个 元 素 ( 向 左 或 同 右 ), 并 且 没 有 找到 x, 那么 没有 等 于 值 x 的 
元 素 。 
对 于 更 长 的 序列 , 二 分 查找 比 find( )( 线 性 查找 ) 的 速度 更 快 。 二 分 查找 的 标准 库 算法 是 search( ) 
和 equal_range( ) 。 我 们 说 的 “更 长 ”的 含义 是 什么 呢 ? 即使 序列 中 只 有 10 个 元 素 , 也 足以 体现 出 
search( ) 与 fnd( ) 相 比 的 优势 。 对 于 一 个 有 1000 个 元 素 的 序列 , search( ) 比 find( ) 的 速度 要 快 200 
倍 ; 见 21.6.4 节 。 
binary_search 算法 有 两 种 变形 : 
template<class Ran, class T> 
bool binary_search(Ran first, Ran last, const T& val); 


template<class Ran, class T, class Cmp> 
bool binary_search(Ran first, Ran last, const T& val, Cmp cmp); 


这 些 算法 要 求 和 假设 输入 序列 是 排序 过 的 。 如 果 没有 排序 ,那么 就 会 发 生 “ 有 趣 的 事 "( 例如 无 限 
循环 ) 。binary_search( ) 告诉 我 们 一 个 信 是 否 存在 : 


void f(vector<string>& vs) /vsis sorted 
{ 
if (binary_search(vs.begin(),vs.end(), "starfruit")) { 
AH we have a starfruit 


} 


1... 
} 


因此 , 如 果 我 们 只 关心 一 个 值 是 否 在 序列 中 , 那么 binary_search( ) 是 理想 的 。 如 果 我 们 关心 找到 

的 元 素 , 我 们 可 以 使 用 low_bound( ) 、upper_bound( ) 或 equal_range( )( 见 23.4 节 和 附录 B. 5.4)。 

在 我 们 关心 找到 哪个 元 素 的 情况 下 , 原因 在 于 对 象 通常 比 关 键 字 包含 更 多 信息 ,这 里 很 多 元 素 有 
可 能 具有 相同 的 关键 字 , 或 者 我 们 希望 找到 符合 某 种 查找 规则 的 元 素 。 


全》 简单 练习 


在 每 一 步 操 作 之 后 打印 vector。 
1. 定义 struct Item | string name; int iid; double value; /*…*/| ; 并 定义 一 个 vector < item > 类 型 的 对 象 vi， 
且 通 过 一 个 文件 对 其 进行 初始 化 以 使 其 包含 10 个 元 素 。 
. 根据 name 对 vi 排序 。 
. 根据 iid 对 vi 排序 。 
. 根据 value 对 vi 排序 ; 按 value 的 降序 打印 ( 即 先 打印 最 大 的 值 ) 。 
. 插入 Item(“horse shoe” 99, 12. 34) 和 Item( “Canon S400”, 9988, 499.95)。 
. 通过 name 删除 ( 擦 除 )vi 中 的 两 个 Item 元 素 。 
. 通过 iid 删除 ( 擦 除 )vi 中 的 两 个 Item 元 素 。 
. 采用 list < LItem > 类 型 而 不 是 vector < Item > 类 型 重复 上 述 练习 
现在 采用 map 类 型 : 
1. 定义 一 个 map < string, int > 类 型 的 对 象 msi。 


oo ~] 个 上 to 
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oo ~ 人] 中 人 


. 插入 10 个 (名 字 , 值 ) 对 , 例如 ,msi[“jlecture”] =21。 

. 通过 cout 输出 (名 字 , 值 ) 对 , 输出 的 格式 可 由 读者 自行 定义 。 
.删除 msi 中 的 (名 字 , 值 ) 对 。 

.编写 一 个 函数 , 该 函数 能 够 从 cin 中 读 取 值 对 并 将 其 存 人 msi 之 中 。 
. 从 输入 读 入 10 个 值 对 , 并 将 它们 存 人 msi 中 。 

.将 msi 的 元 素 写 人 cout。 

. 输出 msi 中 ( 整 型 ) 数 值 的 总 和 。 


9， 定 义 一 个 map < int，string > 类 型 的 对 象 mis。 


10. 


11. 


将 msi 中 的 值 存 入 mis; 也 就 是 说 ,如 果 msi 的 元 素 为 (“lecture”， 21)， 则 mis 应 具有 元 素 (21， “Jec- 


ture” )o 


通过 cout 输出 mis 的 元 素 。 


采用 vector 类 型 . 


wm 上 mh 


， 从 一 个 文件 中 读 和 一些 浮 点 值 ( 至 少 16 个 ) , 并 将 其 存 人 一 个 vector < double > 类 型 的 对 象 vd 有 征 
. 通过 cout 输出 vd。 


定义 一 个 vector < int > 类 型 的 对 象 vi, 且 vi 具有 的 元 素数 量 与 vd 相同 ; 将 vd 的 元 素 拷贝 至 如 中 。 


. 通过 cout 输出 (vd[i], viLij ) 值 对 , 且 每 一 行 输出 一 个 值 对 。 


输出 vd 元 素 的 总 和 。 


。 输出 vd 元 素 总 和 与 vl 元 家 总 和 的 差 值 。 
. 标准 库 中 存在 一 种 称 为 reserve 的 算法 , 且 该 算法 以 一 个 序列 (由 一 对 迭代 器 定义 ) 作 为 参数 ; 倒转 vd, 并 


通过 cout 输出 vd。 


. 计算 vd 中 元 素 的 平均 值 , 并 将 结果 输出 。 


.定义 一 个 vector < double > 类 型 的 对 象 vd2, 并 将 vd 中 所 有 取 值 低 于 (小 于 ) 平 均值 的 元 素 拷贝 至 vd2 中 。 
10， 


对 vd 进行 排序 , 并 输出 vd。 


起 》 思 考题 


~ 人 了 站 hi 记 一 


. 有 用 的 STL 算法 的 例子 有 哪些 ? 

.find( ) 有 什么 用 途 ? 至 少 给 出 5 个 例子 。 
count_if( ) 有 什么 用 途 ? 

.sort(b, e) 的 排序 标准 是 什么 ? 

. SIL 算法 如 何 将 一 个 容器 作为 其 输入 参数 ? 
.SIL 算法 如 何 将 一 个 容器 作为 其 输出 参数 ? 
. SIL 算 法 通常 如 何 表 示 “ 未 找到 ”或 “失败 ”? 
. 什么 是 函数 对 象 ?- 

， 了 天数 对 象 与 范 数 之 间 有 哪些 区 别 ? 

. 什么 是 谓词 ? 

. accumulate( ) 有 什么 用 途 ? 

.inner_product( ) 有 什么 用 途 ? 

. 什么 是 关联 容器 ? 至 少 给 出 5 个 例子 。 

. list 是 一 个 关联 容器 吗 ? 为 什么 不 是 ? 

. 什么 是 二 叉 树 的 基本 排序 属性 ? 

.对 于 一 棵 树 而 言 ,对 其 进行 平衡 有 什么 含义 ? 
. map 的 每 一 个 元 素 占 用 了 多 少 空间 ? 
Vector 的 每 一 个 元 素 占 用 了 多 少 空间 ? 

， 当 一 个 (有 序 的 )map 可 用 时 , 为 什么 我 们 还 会 使 用 unordered_map? 
.set 如 何 区 别 于 map? 

.multi_map 如 何 区 别 于 map? 
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当 我 们 能 够 “仅仅 编写 一 个 简单 的 循环 时 ”, 为 什么 我 们 还 应 使 用 copy( ) 算 法 ? 
什么 是 二 分 搜索 ? 


对 术语 


accumulate( ) find( ) 搜索 算法 
find_if( ) 序列 应 用 :() 函数 对 象 
set 关联 容器 一 般 性 sort( ) 
平衡 树 散 列 函数 排序 binary_search( ) 
inner_product( ) 流 和 迭代 器 copy( ) lower_bound( ) 
unique_copy( ) copy_if( ) map nordered_map( ) 
equal_range( ) 谓词 upper_bound( ) 

<》 习 是 


nD 一 


10. 
11. 
12. 


13. 


14. 


. 浏览 本 章 所 有 内 容 , 并 完成 所 有 你 未 完成 的 “ 试 一 试 ” 练 习 。 

.找到 一 个 STIL 文档 的 可 靠 来 源 , 并 列举 出 所 有 标准 库 算 法 。 

.实现 count( ) 并 对 其 进行 测试 。 

. 实现 count_if( ) 并 对 其 进行 测试 。 

.如果 我 们 不 能 通过 返回 end( ) 表示 “未 找到 ”, 那么 我 们 应 该 怎么 办 ? 重新 设计 并 实现 find( ) 和 count( )， 


并 将 迭代 器 设 为 指 回 第 一 个 和 最 后 一 个 元 素 。 将 实现 与 标准 版 本 进行 比较 。 


. 在 21.6.5 节 的 水 果 示 例 中 , 我 们 将 Fmit 对 象 拷贝 至 set 中 。 那 么 , 如果 我 们 不 希望 拷贝 Fruit 对 象 呢 ? 我 


们 可 以 使 用 set < BFmuit” > 类 型 的 对 象 作 为 替代 。 然 而 , 为 了 这 么 做 , 我 们 还 需要 为 这 一 集合 定义 一 个 比 
较 操作 。 通 过 set < Fruit”，Fruit_comparison > 实现 水 果 示 例 , 并 讨论 两 种 实现 之 间 的 差别 。 


. 为 vector < int > 类 型 编写 一 个 二 分 查找 函数 (不 使 用 标准 函数 ) 。 你 可 以 选择 任何 你 喜欢 的 接口 , 对 该 函 


数 进行 测试 。 你 是 否 确信 你 的 二 分 查找 是 正确 的 ? 现在 为 list < string > 类 型 编写 一 个 二 分 查找 函数 。 对 
该 函数 进行 测试 。 这 两 个 二 分 查找 函数 彼此 之 间 的 相似 程度 如 何 ? 如 果 你 没有 学 习 STL 的 相关 知识 , 你 
认为 这 两 个 二 分 查找 函数 的 相似 程度 应 该 如 何 ? 


.对 21.6. 1 节 中 词 频 的 例子 进行 修改 , 以 使 得 它 能 够 根据 频率 顺序 对 每 一 行进 行 输出 (而 不 是 以 字典 顺 


序 ) 。 一 个 例子 是 , 输出 应 该 是 3; C++ 而 不 是 C++ : 3。 


， 定义 一 个 Order 类 , 该 类 包含 (顾客 ) 姓 名 、 地址、 数据 与 vector < Purchase > 等 成 员 。Purchase 是 一 个 包含 


(产品 )name、unit_price 和 count 等 成 员 的 类 。 定 义 一 种 将 Order 内 容 瑟 人 文件 以 及 从 文件 中 读 入 Order 内 
容 的 机 制 。 构 建 一 个 具有 至 少 10 个 Order 对 象 所 包含 内 容 的 文件 , 将 该 文件 内 容 读 入 一 个 vector 
< Order > 类 型 的 对 象 中 , 根据 (顾客 ) 姓 名 进行 排序 , 并 将 vector < Order > 中 包含 的 内 容 写 回 文件 。 构 建 
另 一 个 具有 至 少 10 个 Order 对 象 所 包含 内 容 的 文件 , 将 文件 内 容 读 和信 一 个 list < Order > 类 型 的 对 象 中 ， 
根据 (顾客 ) 地 址 进行 排序 , 并 将 list < Order > 中 包含 的 内 容 写 回 文件 。 通 过 std :: merge( ) 将 两 个 文件 的 
内 容 合 并 , 并 写 人 另 一 个 文件 。 


计算 上 一 练习 中 所 形成 的 两 个 文件 中 订单 的 总 价值 。 一 个 独立 的 Purchase 的 价值 为 unit_price* count。 
设计 一 个 GUI 接口 以 向 文件 输入 Order 信息 。 

设计 一 个 GUI 接口 以 对 包含 Order 信息 的 文件 进行 查询 ; 例如 ,“ 查 找 Joe 下 的 所 有 订单 ”,“ 查 询 文件 
Hardware 中 订单 的 总 价值 ”以 及 “ 列 出 文件 Clothing 中 的 所 有 订单 ”。 提 示 : 首先 设计 不 包含 GUI 接口 的 
程序 ; 然后 , 在 该 程序 基础 上 实现 GUI 接口 。 

编写 一 个 程序 , 该 程序 能 够 对 文本 文件 进行 “整理 ”以 使 所 得 的 文件 能 够 用 于 一 种 单词 查询 程序 ; 也 就 是 
说 , 用 空白 符 取 代 标 点 符号 , 将 单词 转换 为 小 写 形式 , 用 do not 取代 dont( 等 等 ), 以 及 去 除 复数 形式 
(例如 ，ships 变 为 ship)。 不 要 对 程序 要 求 太 高 。 例 如 , 确定 复数 形式 通常 是 困难 的 , 因此 如 果 你 同时 找 
到 了 单词 ship 和 ships, 那么 你 只 需 去 除 s。 将 程序 用 于 一 个 真实 的 至 少 包含 5000 个 单词 的 文本 文件 ( 例 
如 , 一 篇 研究 论文 )。 

编写 一 个 程序 (使 用 上 一 练习 的 结果 ), 该 程序 能 够 回答 诸如 “文件 中 单词 ship 出 现 了 多 少 次 ?”“ 哪 一 个 
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单词 出 现 最 频繁 ?”“ 文 件 中 最 长 的 单词 是 什么 ?”“ 哪 个 单词 最 短 ?”“ 列 出 所 有 以 铬 开 头 的 单词 . 列 册 所 
有 包含 4 个 字符 的 单词 。” 
15. 为 上 一 练习 中 的 程序 设计 一 个 CUI 接口 。 


全》 附 言 


SIL 是 ISO C++ 标 准 库 中 关于 容器 和 算法 的 部 分 。 它 提供 了 非常 通用 、 灵活 和 有 用 的 基本 工具 。 它 能 
够 节省 我 们 的 很 多 工作 量 ; 重新 发 明 车 轮 可 能 是 有 趣 的 , 但 这 并 没有 什么 太 大 的 意义 。 除 非 我 们 有 足够 的 
理由 不 使 用 STL, 否则 我 们 应 该 总 是 使 用 STL 容器 和 基本 算法 。 而 且 , STL 是 泛 型 编程 的 一 个 例子 , 它 展示 
了 实际 问题 及 其 解决 方案 是 如 何 构成 一 个 有 用 且 通 用 的 工具 集 的 。 如 果 你 需要 对 数据 进行 处 理 ( 且 大 部 分 
程序 是 这 么 做 的 )STL 提供 了 一 个 例子 、 一 些 思想 以 及 一 种 有 用 的 方法 。 
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第 22 章 理念 和 历史 


“如 果 某 人 说 ， “我 想 要 这 样 一 种 程序 设计 语言 ,我 只 需 说 出 我 希望 做 什么 ， 
它 就 能 帮 我 完成 ， 那么 就 给 他 一 个 棒 棒 糖 吧 。 
Alan Perlis 





本 章 简 要 、 有 选择 性 地 介绍 了 程序 设计 语言 的 历史 和 语言 的 设计 理念 。 这 种 理念 和 表达 它 的 
语言 是 达到 专业 水 平 的 基础 。 由 于 本 书 使 用 C++ 语言 , 因此 我 们 主要 关注 C++ 以 及 影响 C++ 的 
其 他 语言 。 本 章 引 在 对 本 书 所 介绍 的 思想 给 出 其 缘 景 和 前 景 。 对 每 种 语言 , 我 们 会 介绍 其 设计 
者 : 一 种 语言 不 仅仅 是 一 种 抽象 的 创造 , 还 是 一 个 具体 的 解决 方案 一 一 是 人 对 实际 中 所 遇 到 的 问 
题 的 回应 。 


22. 1 历史 、 理 念 和 专业 水 平 


“历史 是 一 堆 废话 ?这 是 享 利 . 福特 的 名 言 。 然 而 在 很 久 以 前 , 一 个 相反 的 观点 就 被 广泛 引用 
了 :“ 不 能 记 住 历史 的 人 注定 要 重复 历史 。” 这 里 的 关键 问题 是 , 我 们 应 该 选择 了 解 哪 一 部 分 历史 ， 
又 应 该 气 弃 哪 一 部 分 :“95% 的 事情 都 是 无 用 的 ”是 男 一 个 相关 的 论调 (虽然 我 们 认为 95% 可 能 是 
一 个 低估 的 数字 ) 。 对 于 历史 和 当前 实践 的 关系 , 我 们 认为 如 果 对 历史 没有 一 定 的 理解 ,就 不 可 
“能 达到 专业 水 平 。 如 果 你 几乎 不 了 解 你 所 在 领域 的 背景 ， 你 就 很 容易 被 蒙蔽 ,历史 中 有 太 多 这 样 
的 例子 , 任何 领域 都 充满 了 似是而非 而 又 没有 实际 作用 的 内 容 。 历 史 的 真正 意义 在 于 那些 已 经 在 
实践 中 证 明 自 身价 值 的 思想 和 理念 。 

我 们 乐于 探讨 很 多 程序 设计 语言 和 软件 (如 操作 系统 、 数 据 库 、 图 形 软件 、 互 联网 软件 、Web、 
肢 本 等 ) 中 的 关键 性 思想 的 起 源 , 你 当然 还 会 发 现 其 他 很 多 重要 上 且 有 用 的 软件 和 程序 设计 领域 。 
我 们 的 篇 幅 甚 至 不 够 (仅仅 是 ) 揭 开 程 序 设计 语言 理念 和 历史 的 面纱 。 

程序 设计 的 最 终 目标 一 定 是 生成 有 用 的 系统 ， 人们 在 热烈 讨论 程序 设计 技术 和 语言 时 ,常常 
会 鲜 记 这 一 点 。 和 干 万 不 要 忘记 它 ! 如 果 你 需要 提醒 , 那么 请 重新 阅读 第 1 章 。 
22. 1. 1 程序 设计 语言 的 目标 和 哲学 

程序 设计 语言 是 什么 ? 程序 设计 语言 可 以 为 我 们 做 什么 2“ 程序 设计 语言 是 什么 ”的 常见 答 

e 指示 机 器 操作 的 一 种 工具 
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。 算 法 的 符号 表示 法 

。 与 其 他 程序 员 交流 的 工具 

。 进行 实验 的 工具 

。 控制 电脑 设备 的 一 种 手段 

。 表示 各 种 概念 之 间 关 系 的 一 种 方法 

。 表达 高 层 设计 的 一 种 方法 “ 

而 我 们 的 答案 是 “以 上 答案 都 对 , 而 且 还 有 其 他 的 答案 ”! 显然 , 我 们 首先 要 考虑 那些 应 用 于 
常见 领域 的 程序 语言 , 这 是 贯穿 本 章 的 内 容 。 此 外 , 还 有 一 些 专用 程序 语言 和 应 用 于 特定 领域 的 
程序 语言 , 这 些 程序 语言 应 用 面 比较 窗 并 且 有 着 更 明确 的 使 用 目的 。 

我 们 希望 程序 设计 语言 具有 哪些 特性 呢 ? 

。 可 移植 性 

。 类 型 安全 

。 定义 准确 

。 高 性 能 

。 简明 表达 思想 的 能 力 

。 易 调试 

。 易 测试 

。 能 访问 所 有 系统 资源 

。 平台 独立 性 

。 可 运行 在 所 有 平台 上 

。 长 期 稳定 性 

。 能 针对 应 用 领域 的 变化 做 适当 的 改变 

。 易于 学 习 

。 轻 量 级 

a 支持 流行 的 程序 设计 模式 ( 例如 面向 对 象 程序 设计 和 泛 型 程序 设计 ) 

。 有 利于 程序 分 析 

。 提供 大 量 工具 

。 大 规模 社 群 的 支持 

。 适合 初学 者 (如 学 生 、 自 学 者 ) 学 习 

。 为 专业 人 员 ( 如 建筑 工程 师 ) 提 供 全 面 的 工具 

。 有 大 量 软件 开发 工具 可 选用 

。 有 大 量 软件 组 件 ( 如 各 种 库 ) 可 选用 

。 被 一 个 开放 的 软件 社 群 所 支持 

。 被 主要 的 平台 厂商 所 支持 (如 微软 、IBM 等 ) 

不 幸 的 是 , 我 们 不 能 同时 拥有 所 有 这 些 特 性 。 这 非常 令 人 失望 ,因为 客观 地 说 每 一 种 特性 都 
很 好 : 它们 都 能 为 程序 设计 提供 帮助 , 没有 提供 这 些 特性 的 程序 语言 会 给 程序 员 带 来 额外 的 工作 
量 和 复杂 性 。 我 们 不 能 同时 拥有 这 些 特性 的 原因 很 简单 : 有 一 些 特性 是 相互 排斥 的 。 例 如 , 你 不 
可 能 在 拥有 100% 的 平台 独立 性 的 同时 , 还 能 访问 到 系统 的 所 有 资源 ; 一 个 程序 可 以 访问 某 种 资 
源 , 但 这 一 资源 并 不 是 每 个 平台 都 会 提供 , 因此 这 个 程序 不 可 能 在 所 有 平台 都 能 运行 。 与 之 类 
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似 , 我 们 非常 希望 一 种 语言 (包括 它 的 工具 和 库 ) 是 轻 量 级 的 并 且 容 易学 习 , 但 是 这 样 就 不 可 能 为 
所 有 系统 和 应 用 领域 都 提供 全 面 的 支持 。 
这 就 是 语言 设计 理念 的 重要 之 处 。 对 语言 、 库 、 工具 以 及 程序 的 设计 者 , 这 些 理 念 指导 他 们 
对 技术 进行 选择 和 取舍 。 没 错 ， 当 你 编写 程序 的 时 候 , 你 就 是 一 个 设计 者 ,必然 要 进行 技术 的 选 
择 和 取舍 。 | 
22. 1.2 编程 理念 : 
《The C++ Programming Language》 的 前 言 中 提 到 ,“C++ 语 言 是 一 种 通用 程序 设计 语言 , 它 的 
一 个 主要 设计 目的 就 是 让 那些 认真 严肃 的 程序 员 也 能 体验 到 程序 设计 的 乐趣 。” 这 是 什么 意思 ? 
程序 设计 不 就 是 生产 产品 吗 ? 不 就 是 正确 性 、 质 量 和 可 维护 性 吗 ? 不 就 是 上 市 日 期 吗 ? 不 就 是 对 
软件 工程 的 支持 吗 ? 当然 , 这 些 说 法 都 没 错 , 但 是 我 们 不 能 忘记 程序 员 一 一 也 就 是 人 。 考 虑 另外 
一 个 例子 ， Don Knuth 说 过 ,“Alto 最 好 的 特性 就 是 它 不 会 在 晚上 运行 得 更 快 "。Alto 是 来 自 Palo 
Alto 研究 中 心 (PARC) 的 一 台 计 算 机 ,是 最 早 的 “个 人 计算 机 ”之 一 。 而 当时 的 主流 计算 机 是 与 之 
相对 的 “分 时 共享 计算 机 ”, 在 白天 会 有 大 量 用 户 竞争 访问 计算 机 (因而 晚上 会 运行 更 快 ) 。 
程序 设计 工具 和 技术 存在 的 意义 是 为 了 让 程序 员 能 更 好 地 工作 并 得 到 出 更 好 的 成 果 。 请 不 
要 忘记 这 一 点 。 那 么 , 什么 样 的 指导 方针 可 以 帮助 程序 员 以 最 小 的 代价 设计 出 最 好 的 软件 呢 ? 本 
书 自始至终 都 在 阐述 我 们 对 此 的 理念 , 因此 本 节 只 是 对 这 些 内 容 做 一 个 总 结 。 
我 们 希望 自己 的 代码 有 良好 结构 的 主要 原因 是 , 在 良好 结构 下 , 我 们 可 以 不 必 花 费 很 大 力气 
就 能 修改 程序 。 结 构 越 好 , 修改 程序 、 寻 找 和 修正 错误 、 增加 新 特性 、 移 植 到 新 的 体系 结构 中 以 
及 优化 性 能 等 工作 就 更 容易 。 这 就 是 我 们 所 说 的 “良好 ”的 准确 含义 。 
在 本 节 的 剩余 部 分 , 我 们 将 
e 重新 审视 我 们 尝试 达到 的 目标 , 也 就 是 我 们 想 从 代码 中 得 到 什么 。 
e 提出 两 种 一 般 性 的 软件 开发 方法 , 并 说 明 两 者 的 结合 使 用 比 单独 使 用 其 中 任何 一 种 方法 
都 要 更 好 。 
e 思考 用 代码 表达 程序 结构 的 关键 问题 ， 
a 直接 表达 思想 
s 抽象 层次 
sa 模块 化 
"一致 性 和 最 小 化 
理念 就 是 要 拿 来 用 的 。 它 是 思考 的 工具 , 而 不 仅仅 是 用 来 取悦 管理 人 员 和 考核 人 员 的 华丽 的 
词汇 。 我 们 编写 的 程序 应 该 尽力 接近 设计 理念 。 当 我 们 陷入 程序 泥潭 的 时 候 , 最 好 回 过 头 来 看 一 
看 , 问题 是 否 出 在 违背 了 设计 理念 ， 有 时 这 是 很 有 帮助 的 。 当 评估 一 个 程序 时 (最 好 是 在 交付 用 
户 之 前 ), 我 们 应 该 寻找 那些 违背 设计 理念 的 部 分 , 这 些 部 分 是 将 来 最 有 可 能 出 问题 的 地 方 。 应 
该 尽 可 能 广泛 地 应 用 设计 理念 , 但 也 要 考虑 实践 相关 问题 (例如 性 能 和 简单 性 ) 和 语言 的 弱点 (不 
存在 完美 的 语言 ), 这 些 因素 会 阻碍 我 们 得 到 更 接近 设计 理念 的 结果 。 
设计 理念 可 以 指导 我 们 做 出 具体 的 技术 决策 。 例 如 , 我 们 不 能 孤立 地 对 一 个 库 的 每 个 接口 都 
做 出 决策 (参见 14. 1 节 ) , 这 样 得 到 的 结果 将 非常 糟糕 。 正 确 的 方法 是 : 回 到 我 们 的 基本 原则 , 首 
先 确定 对 于 这 个 特定 的 库 来 说 什么 是 最 重要 的 , 然后 设计 一 套 一 致 的 接口 集合 。 理 想 情 况 下 , 我 
们 应 该 在 文档 和 代码 注释 中 清楚 地 描述 出 这 个 特定 设计 方案 所 遵循 的 设计 原则 及 其 中 的 折衷 
选择 。 
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在 一 个 项 目的 开始 , 首先 应 该 回顾 设计 理念 , 找 出 它 与 待 解决 问题 及 其 解决 方案 最 初 思路 的 
相关 之 处 。 这 是 获得 和 优化 设计 思路 的 好 方法 。 随 后 在 设计 和 开发 过 程 中 , 当 你 陷 人 困境 时 ,， 回 
过 头 来 查看 一 下 程序 中 哪个 部 分 偏离 设计 理念 最 远 一 一 这 些 就 是 最 有 可 能 隐藏 错误 、 出 现 设计 缺 
陷 的 地 方 。 与 “在 相同 的 地 方 反复 查看 、 用 相同 技术 反复 寻找 错误 ”的 基本 调试 技术 相 比 , 这 种 方法 
提供 了 另 一 种 调试 途径 。“ 错 误 总 是 存在 于 你 没有 查看 的 地 
22. 1.2.1 我 们 需要 的 是 什么 
典型 情况 下 , 我 们 需要 
。 正 确 性 : 是 的 , 定义 什么 是 “正确 的 ”非常 困难 ， 但 这 却 是 完成 工作 的 重要 一 步 。 通 常 , 对 
于 一 个 给 定 项 目 , 别人 会 为 我 们 给 出 正确 性 的 定义 , 但 是 接 下 来 我 们 还 是 要 理解 其 含义 。 

。 可 维护 性 : 每 个 成 功 的 程序 都 会 随 着 时 间 的 推移 而 修改 ; 它 可 能 会 被 移植 到 新 的 硬件 或 软 
件 平台 上 , 可 能 添加 一 些 新 的 功能 , 或 者 需要 修改 新 发 现 的 错误 。 下 面 一 节 关 于 程序 结构 
理念 的 内 容 就 讨论 了 可 维护 性 。 

。 性 能 : 性 能 (“效率 ” ) 是 一 个 相对 的 概念 。 性 能 必须 与 程序 的 用 途 相 适应 。 有 一 种 常见 的 

观点 : 高 效 的 代码 必然 是 低层 的 , 结构 良好 的 高 层 代码 会 导致 低 效 。 而 我 们 的 经 验 恰恰 相 
反 , 达到 满意 性 能 的 途径 通常 是 遵循 我 们 所 推荐 的 理念 和 方法 。 例 如 ,STL 就 是 一 个 同时 
兼顾 抽象 和 高 效 的 代码 。 执 迷 于 低层 细节 与 不 导 于 低层 细节 一 样 容易 导致 糟糕 的 性 能 。 

。 按 时 交付 : 交付 给 用 户 一 个 完美 的 程序 , 但 时 间 上 却 延 期 了 一 年 , 这 一 般 是 无 法 接受 的 。 

显然 , 人们 的 期 望 常常 不 切实 际 , 但 是 , 我 们 必须 在 合理 的 时 间 内 交付 高 质量 的 软件 。 一 
种 观点 认为 “按时 完成 "就 意味 着 粗制滥造 , 这 并 不 是 事实 。 相 反 , 我 们 发 现 重视 良好 的 
结构 (例如 , 资源 管理 、 不 变 式 和 接口 设计 ) 、 设 计时 考虑 测试 、 恰 当地 使 用 库 ( 经 常 是 为 
特定 应 用 或 特定 领域 而 设计 的 库 ) 是 如 期 完工 的 有 效 方法 。 

这 些 目标 要 求 我 们 关注 代码 结构 : 

。 如 果 程 序 中 有 错误 (每 一 个 大 型 程序 都 有 错误 ), 清晰 的 结构 有 助 于 发 现 错误 。 

。 如 果 需 要 让 初学 者 理解 程序 或 者 需要 修改 程序 , 清晰 的 结构 会 比 一 大 堆 细节 更 容易 理解 。 

。 如 果 程 序 遇 到 了 性 能 问题 , 高 层 程序 (更 接近 设计 理念 , 并 有 良好 的 结构 ) 比 低层 程序 或 

凌乱 的 程序 更 易于 性 能 调整 。 首 先 , 高 层 程序 更 易于 理解 。 其 次 , 相对 于 低层 程序 , 高 层 
程序 在 设计 早期 就 已 经 考虑 测试 和 性 能 调整 因素 了 。 

请 注意 程序 的 可 理解 性 。 任 何 能 帮助 我 们 理解 、 分 析 程序 的 方法 都 是 有 益 的 。 基 本 上 ， 规律 
性 总 比 不 规律 要 好 ， 只 要 这 种 规律 性 不 是 因为 过 度 简化 而 形成 的 。 

22.1.2.2 一 般 性 的 方法 

编写 正确 的 软件 ， 有 两 种 方法 : 

e 自 底 向 上 (bottom-up): 只 用 已 证 明正 确 性 的 组 件 来 构建 系统 。 

。 自 顶 向 下 (top-down) : 用 可 能 包含 错误 ,但 是 能 捕获 所 有 错误 的 组 件 来 构建 系统 。 

有 趣 的 是 , 大 部 分 可 靠 系统 都 是 组 合 这 两 种 截然 相反 的 方法 来 构造 的 。 原 因 很 简单 : 对 于 一 
个 大 型 的 真实 系统 而 言 , 任何 一 种 方法 都 无 法 提供 所 需 的 正确 性 、 适 应 性 和 可 维护 性 : 

。 我 们 无 法 构造 并 “证明 ”足够 多 的 基本 组 件 来 消除 所 有 错误 源 。 

。 当 组 合 有 错误 的 基本 组 件 (如 库 、 子 系统 、 关 层 次 等 ) 来 构建 最 终 系 统 时 ， 我 们 无 法 完全 弥 

补 组 件 的 缺陷 。 
两 种 方法 的 结合 比 任何 一 种 方法 单独 使 用 都 要 好 : 我 们 可 以 实现 (或 借用 或 购买 ) 足够 好 的 组 件 ， 
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其 遗留 的 错误 可 以 通过 错误 处 理 机 制 和 系统 化 的 测试 来 弥补 。 而 且 , 如 果 我 们 坚持 构造 更 好 的 组 
件 , 就 可 以 用 它们 构造 出 更 大 的 组 件 ， 从 而 减少 对 “凌乱 的 专用 代码 ”的 需求 。 

测试 是 软件 开发 的 重要 一 环 , 我 们 将 在 第 26 章 中 详细 介绍 。 测 试 是 一 种 系统 化 地 寻找 错误 
的 方法 。“ 尽 早 测试 和 日 常 化 测试 "是 一 个 流行 的 观点 。 我 们 在 程序 设计 时 就 应 该 考虑 测试 问题 ， 
努力 使 测试 更 简单 , 并 使 错误 在 杂乱 的 代码 中 更 难以 “藏身 ”。 

22.1.2.3 思想 的 直接 表达 

当 我 们 表达 某 事物 时 (不 管 它 是 高 层 的 还 是 低层 的 ) 理 想 的 情况 是 直接 用 代码 来 表达 ,而 不 是 
用 其 他 辅助 方式 。 这 一 理念 有 几 种 不 同形 式 : 

e 用 代码 直接 表达 思想 。 例 如 , 用 特殊 类 型 (如 Month 或 Color) 表示 参数 ， 比 一 般 类 型 (如 

int) 更 好 。 

。 用 代码 独立 地 表达 相互 独立 的 思想 。 例 如 , 除 少数 情况 外 , 标准 sort( ) 算法 可 以 对 任意 元 
素 类 型 的 标准 容器 进行 排序 ; 排序 、 比 较 操 作 、 容 器 和 元 素 类 型 的 概念 是 独立 的 。 而 假如 
我 们 构造 了 一 个 “veetor， 其 对 象 在 自由 空间 上 分 配 , 元 素 类 型 是 Object 的 派生 类 , 此 类 定 
义 了 一 个 before( ) 成 员 函 数 , 供 veetor :: sort( ) 使 用 ”, 那么 就 得 到 了 一 个 远 不 如 标准 sort( ) 
那么 通用 的 sort( ) ,因为 我 们 对 存储 、 类 层次 、 可 用 的 成 员 了 录 数 、 次 序 等 等 做 出 了 假设 。 
用 代码 直接 表达 思想 之 间 的 关系 。 最 常见 的 可 以 直接 表达 的 关系 是 继承 (例如 ，Circle 是 
一 种 Shape) 和 参数 化 (例如 ,vector <T > 表示 所 有 向 量 都 具有 的 共性 , 与 特定 的 元 素 类 型 
无 关 )。 
自由 组 合 代 码 表达 的 思想 一 一 当 且 仅 当 这 种 组 合 有 意义 时 。 例 如 ，sort( ) 允许 我 们 使 用 各 
种 不 同 的 元 素 类 型 和 各 种 容器 , 但 元 到 必须 支持 < (如 果 不 支 持 , 我 们 在 使 用 sort( ) 时 就 
要 用 一 个 额外 的 参数 指定 比较 操作 ) , 且 容 器 必须 支持 随机 访问 迭代 器 。 
简单 地 表达 简单 的 思想 。 遵 循 上 述 理念 , 会 导致 过 度 通用 的 代码 。 例 如 , 我 们 可 能 得 出 超 
出 任何 人 需求 的 过 于 复杂 的 类 层次 (继承 结构 ), 或 者 每 个 (明显 ) 人 简单 的 类 都 设置 了 7 个 
参数 。 为 了 避免 每 个 用 户 都 不 得 不 面 对 每 种 可 能 的 复杂 情况 , 我 们 应 尽力 提供 处 理 最 普 
遍 或 者 最 重要 的 情形 的 简单 版 本 。 例 如 , 除了 使 用 op 的 通用 排序 郴 数 sort(b,e, op) 外 ， 
我 们 还 提供 隐 含 使 用 "<" 做 为 比较 操作 的 版 本 sort(b，e) 。 如 果 可 能 的 话 , 我 们 还 想 提供 
使 用 ”<“ 对 标准 容器 进行 排序 的 sort(c) 和 使 用 op 对 标准 容器 进行 排序 的 sort(c，op ) 
(C++0x 就 提供 了 这 两 个 版 本 , 参见 22.2.8 节 )。 

22.1.2.4 抽象 屋 

我 们 更 愿意 在 尽 可 能 高 的 抽象 层 上 工作 ， 即 我 们 的 理念 就 是 以 尽 可 能 一 般 化 的 方式 来 表达 我 
们 的 解决 方案 。 

例如 , 考虑 如 何 表达 电话 本 的 条 目 (就 像 我 们 在 PDA 或 手机 上 保存 它 那 样 ) 。 我 们 可 以 用 
vector < pair < string, Value_type >> 来 表达 (姓名 , 值 ) 对 的 集合 。 然 而 ,如 果 我 们 实际 上 总 是 用 姓 
名 来 访问 该 集合 的 话 ，map < string, Value_type > 是 一 种 更 高 层 的 抽象 , 它 可 以 使 我 们 免 去 编写 (和 
调试 ) 访 问 函 数 的 麻烦 。 另 一 方面 ，vector < pair < string，Value_type >> 又 比 使 用 两 个 数组 srting 
[ max ] 和 Value_type[ max ] 的 表示 方式 抽象 程度 更 高 。 因 为 在 两 个 数组 的 表示 方式 中 , 字符 串 和 它 
的 值 的 关系 是 隐 含 的 。 最 低层 次 的 抽象 可 能 是 一 个 int( 元素 的 个 数 ) 加 上 两 个 void * (指向 某 种 程 
序 员 了 解 却 不 为 编译 器 所 知 的 表示 形式 ) 。 在 我 们 的 例子 中 , 到 目前 为 止 介绍 的 每 种 表示 方式 都 
可 认为 是 非常 低层 的 , 因为 它们 更 关注 值 对 的 表示 形式 ， 而 不 是 其 功能 。 为 了 更 为 接近 实际 应 
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用 , 我 们 可 以 定义 一 个 直接 反映 使 用 方式 的 类 。 例 如 , 我 们 可 以 设计 一 个 Phonebook 类 , 其 接口 方 
便 使 用 , 然后 以 它 为 基础 来 编写 程序 。 这 个 Phonebook 类 可 以 用 上 述 任何 一 种 表示 方法 来 实现 。 

我 们 更 喜欢 较 高 层次 的 抽象 (如 果 我 们 有 一 个 适合 的 抽象 机 制 , 并 且 我 们 的 语言 支持 这 种 抽 
象 机 制 效 率 较 高 的 话 ) 的 原因 是 , 比 起 在 计算 机 硬件 层次 表达 的 解决 方案 , 它 更 接近 于 我 们 思考 
问题 和 解决 问题 的 方式 。 

对 于 低层 抽象 ,， 人 们 使 用 它 的 理由 往往 是 “效率 ”。 但 要 注意 , 你 应 该 仅 在 真正 需要 提高 效率 
时 才 使 用 低层 抽象 (参见 25. 2.2 节 )。 而 且 , 使 用 低级 (更 原始 的 ) 语 言 特性 不 一 定 能 获得 更 好 的 
性 能 。 相 反 , 有 时 还 会 失去 进行 优化 的 机 会 , 而 高 层 程 序 设计 则 可 提供 优化 可 能 。 例 如 ,使 用 
Phonebook 类 ,实现 方式 可 以 在 string[ max j 加 上 Value_typel max ] 和 map < string, Value_type > 之 间 
进行 选择 。 对 于 有 些 应 用 , 前 者 更 有 效 ， 而 对 另 一 些 应 用 则 是 后 者 更 有 效 。 当 然 , 如 果 应 用 程序 
仅 包含 你 的 个 人 通讯 录 , 性 能 不 是 主要 考虑 因素 。 然 而 ， 当 我 们 必须 记录 和 处 理 数 百 万 个 条 目的 
时 候 , 这 种 权衡 就 变 得 很 有 意义 了 。 更 重要 的 是 , 如 果 使 用 低层 特性 , 一 段 时 间 后 ,处 理 低层 特 
性 就 会 占用 程序 员 绝 大 部 分 时 间 ， i ds i o 

22.1.2.S 模块 化 

模块 化 是 一 种 理想 。 我 们 希望 能 用 “组 件 ”( 如 了 清 数 、 类 、 类 层次 、 库 等 ) 来 构建 我 们 的 系统 ， 
这 些 组 件 可 以 独立 构造 、 理 解 和 测试 。 理 想 情 况 下 , 我 们 也 和 希望 每 个 组 件 都 可 以 用 于 很 多 程序 中 
( “重用 ”) 。 所 谓 重 用 (reuse) ， 就 是 用 以 前 测试 过 并 且 在 其 他 地 方 已 经 使 用 过 的 组 件 构建 系统 ， 
也 包括 组 件 的 设计 和 使 用 等 工作 。 在 前 面 讨论 类 、 类 层次 、 接 口 设计 和 泛 型 程序 设计 时 , 我 们 已 
经 接触 过 重用 的 概念 。 我 们 所 讨论 的 大 部 分 “程序 设计 风格 "(参见 22. 1.3 节 ) 都 与 设计 、 实 现 和 
使 用 潜在 的 “可 重用 ”组 件 有 关 。 请 注意 , 并 不 是 每 个 组 件 都 能 用 于 很 多 程序 ; 一 些 代码 过 于 专 
用 , 难以 改进 以 用 于 其 他 地 方 。 z 

代码 中 的 模块 化 应 该 能 反映 出 应 用 中 重要 的 逻辑 差异 。 我 们 不 是 简单 地 把 两 个 完全 无 关 的 
类 A 和 B 放 在 一 个 “可 重用 组 件 ”"C 中 来 “提高 重用 性 ”。 由 于 需 将 A 和 B 的 接口 合并 为 C 的 接 
口 ,这 会 使 代码 复杂 化 : 





如 上 图 所 示 , 用 户 1 和 用 户 2 都 使 用 C。 除 非 你 查看 了 C 的 内 部 , 否则 你 可 能 认为 两 个 用 户 从 组 
件 共 享 中 受益 了 。 从 共享 (“重用 ” ) 中 获得 的 益处 (在 本 例 中 , 实际 并 未 受益 ) 应 该 包括 更 好 的 测 
试 、 更 少 的 代码 总 量 、 更 大 的 用 户 基础 等 。 不 幸 的 是 , 虽然 本 例 有 一 些 过 度 简化 , 但 所 呈现 的 问 
题 并 不 是 一 个 特别 罕见 的 现象 。 

如 何 做 才能 解决 这 个 问题 呢 ? 也 许 应 该 提供 一 个 A 和 B 公共 接口 : 


“用户! ”用 户 2 用 户 ! ”用 户 2 
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两 个 图 旨 在 表示 继承 和 参数 化 。 在 这 两 种 情况 下 , 为 了 使 重用 更 有 价值 , 所 提供 的 接口 必须 要 比 A 
和 B 的 接口 的 简单 合并 更 小 。 换 句 话 说 , A 和 B 必须 要 有 一 个 能 使 用 户 受 益 的 最 小 的 基本 共性 集 
合 。 请 注意 , 我 们 又 回 到 了 接口 问题 (参见 9.7 节 和 25.4.2 节 ) 和 不 变 式 问 题 (参见 9.4.3 节 )。 

22.1.2.6 一致 性 和 简约 主义 

一 致 性 和 简约 主义 是 最 基本 的 设计 理念 。 所 以 我 们 可 能 因 表象 而 忽略 它们 。 不 过 ,如果 一 个 
设计 已 经 非常 杂乱 , 想 要 优雅 地 重新 表达 它 确实 很 困难 。 因 此 , 一 致 性 和 简约 主义 应 该 作为 设计 
标准 , 在 设计 过 程 中 就 应 该 遵循 , 并 应 该 影响 到 哪怕 最 微小 的 程序 细节 : 

e。 如 果 你 怀疑 一 个 特性 的 效用 , 那么 不 要 添加 这 个 特性 。 

。 为 相似 的 特性 设计 相似 的 接口 ( 和 名 字 ) , 但 有 一 个 前 提 一 一 这 种 相似 性 是 根本 性 的 。 

。 为 不 同 的 特性 设计 不 同 的 名 字 ( 或 许 接口 风格 也 应 不 同 ) , 但 前 提 是 这 种 差异 性 是 根本 

性 的 。 

一 致 的 命名 方式 、 接 口 风 格 和 实现 风格 都 对 维护 工作 有 帮助 。 当 代码 一 致 时 , 新 程序 员 不 需要 对 
庞大 系统 的 每 个 部 分 都 学 习 一 系列 新 的 规范 。STL 就 是 一 个 例子 (参见 第 20 ~21 章 和 附录 B.4 ~ 
B.6) 。 如 果 不 可 能 实现 一 致 性 (例如 ， 程序 包含 古老 的 代码 或 其 他 语言 编写 的 代码 ) ， 一 种 解决 方 
法 是 为 这 些 代码 设计 一 个 与 程序 其 他 部 分 风格 相 吻 合 的 接口 。 与 之 相对 的 是 , 不 做 任何 特殊 处 
理 , 让 外 来 的 ( “陌生 的 ”“ 糟 糕 的 ”) 风格 直接 影响 到 程序 中 要 访问 这 些 令 人 厌烦 的 代码 的 每 个 
部 分 。 z 

一 种 保持 简约 主义 和 一 致 性 的 方法 是 : 仔细 地 (并 且 一 贯 地 ) 为 每 个 接口 做 好 文档 。 这 样 , 我 
们 就 有 更 大 机 会 发 现 不 一 致 的 地 方 和 重复 的 内 容 。 做 好 前 置 条 件 、 后 置 条 件 和 不 变 式 的 文档 , 与 
仔细 留意 资源 管理 和 错误 报告 一 样 , 都 是 非常 有 用 的 。 Os 对 实现 
简洁 的 程序 是 非常 必要 的 (参见 19. 5 节 )。 

对 某 些 程序 员 来 说 ， 关键 的 设计 原则 是 KISS( Keep It Simple, Stupid, 简单 的 才 是 最 好 的 )。 我 
们 甚至 听 到 有 人 声称 KISS 是 唯一 有 价值 的 设计 原则 。 然而 , 我 们 更 倾向 于 一 些 引用 不 那么 广泛 
的 原则 , 例如 “保持 事情 的 简单 性 ”( Keep simple things simple) 和 ” 尽 可 能 保持 简 滞 , 但 不 要 过 分 简 
单 化 ”( Keep it simple，as simple as possible，but no simpler)。 后 一 句 话 引 自 阿尔 伯 特 … 爱 因 斯 坦 ， 
这 人 句 话 表明 , 超出 了 一 定 界 限 的 过 分 简化 是 危险 的 ， 因而 对 设计 是 有 害 的 。 一 个 显然 的 疑问 是 : 

“为 谁 简化 ， 和 谁 比较 ?” 
22.1.3 风格 / 范 型 
| 当 我 们 设计 并 实现 一 个 程序 时 ， 应 该 保持 统一 的 风格 。 Ci 种 基本 的 风格 ， 

。 过 程式 程序 设计 . 

。 数据 抽象 

。 面 问 对 象 程序 设计 

e 泛 型 程序 设计 
这 些 风 格 有 时 ( 某 种 程度 上 有 些 自 夸 ) 称 做 “程序 设计 范 型 。 除 此 之 外 , 还 有 很 多 其 他 “ 范 型 ”， 
如 函数 式 程 序 设 计 、 逻 辑 程序 设计 、 基 于 规则 的 程序 设计 、 基 于 约束 的 程序 设计 以 及 面向 方面 的 
程序 设计 。 但 C++ 并 不 直接 支持 这 些 风 格 ， 而 我 们 也 无 法 在 一 本 人 门 书 籍 中 涵盖 所 有 这 些 内 容 ， 
所 以 可 以 将 其 留 作 将 来 的 工作 。 我 们 介绍 的 玫 种 范 型 /风格 也 有 大 量 细 节 不 得 不 略 去 ,也 都 留 作 
将 来 进一步 地 学 习 : 

e。 过 程式 程序 设计 (procedural programming) : 一 种 利用 函数 ( 对 参数 进 和 了 操作 ) 构 造 程序 的 思 
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想 。 一 些 数学 库 函 数 的 例子 , 和 sqrt( ) 和 cos( )。C++ 通 过 函数 的 概念 来 支持 这 种 风格 

(参见 第 8 章 ) 。 这 种 风格 最 有 价值 的 地 方 在 于 可 以 选择 多 种 方式 传递 参数 : 传 值 、 传 引用 
或 者 常量 引用 。 在 这 种 程序 设计 风格 中 , 数据 通常 被 组 织 为 数据 结构 (stmet) ， 而 不 使 用 
显 式 的 抽象 机 制 ( 如 类 的 私有 数据 成 员 或 成 员 函 数 ) 。 注 意 , 这 种 程序 设计 风格 以 及 函数 
都 是 其 他 风格 不 可 或 缺 的 一 部 分 。 
数据 抽象 (data abstraction) : 其 思想 是 : 首先 为 应 六 用 领域 提供 一 组 适合 的 数据 类 型 ， 然后 使 
用 这 些 数据 类 型 编写 程序 。 和 抢 阵 就 是 一 个 经 典 的 例子 (参见 24. 3 ~24. 6 节 ) 。 这 种 风格 非 
常 注重 显 式 数据 隐藏 (如 使 用 类 的 私有 数据 成 员 ) 。 标 准 的 string 和 vector 都 是 典型 的 例 
子 , 它们 显示 出 了 数据 抽象 和 泛 型 程序 设计 的 参数 化 之 间 的 紧密 联系 。 这 种 风格 之 所 以 
称 做 “抽象 "， 是 因为 我 们 通过 接口 来 访问 数据 类 型 ， 而 不 是 直接 访问 其 实现 。 
面向 对 象 程序 设计 (object-oriented programming) : 其 思想 是 : 将 类 型 组 织 为 层次 结构 ,以 便 
用 代码 直接 表达 它们 之 间 的 关系 。 一 个 经 典 的 例子 是 第 14 章 的 Shape 类 。 如 果 各 类 型 间 
有 固有 的 层次 关系 的 话 , 这 种 风格 显然 是 很 有 价值 的 。 但 它 也 有 被 滥用 的 趋势 , 即 人 们 设 
计 类 型 的 层次 结构 , 并 不 是 基于 其 内 在 的 关系 。 因 此 ， 当 你 设计 派生 类 的 时 候 , 一 定 要 问 
一 下 为 什么 ? 你 想 要 表达 的 是 什么 ? 在 你 的 问题 中 , 基 类 /派生 类 的 差异 会 对 你 有 什么 
帮助 ? 
泛 型 程序 设计 ( generie programming) : 其 思想 是 : 对 于 具体 算法 , 通过 添加 参数 , 来 描述 算 
法 哪些 部 分 可 以 变化 而 不 必 改 变 其 他 部 分 , 从 而 将 算法 “提升 ”到 更 高 的 抽象 层 。 第 20 章 
的 high( ) 是 一 个 简单 的 算法 提升 的 例子 。STL 中 的 find( ) 和 sort( ) 算 法 也 是 体现 了 泛 型 程 
序 设计 思想 的 经 典 算法 。 详 细 情 况 请 参考 第 20 ~21 章 以 及 下 面 的 例子 。 

现在 把 这 些 风格 粮 合 在 一 起 来 感受 一 下 吧 ! 通常 人 们 一 提 到 程序 设计 风格 (“ 范 型 ") , 都 是 将 它 

们 看 做 毫 无 关联 的 : 你 要 么 使 用 泛 型 程序 设计 , 要么 使 用 面向 对 象 程序 设计 。 但 如 果 你 的 目标 是 

尽 可 能 好 地 表达 解决 方案 , 就 需要 组 合 多 种 风格 了 。 这 里 的 “好 ” 是 指 代码 易 读 、 易 编 写 、 易 于 维 

护 以 及 足够 高 效 。 考 虑 这 个 源 于 Simula( 参 见 22.2.6 节 ) 的 经 典 的 “Shape 例子 ”, 它 通常 被 看 做 是 

面向 对 象 程序 设计 的 例子 。 第 一 个 解决 方案 可 能 是 这 样 的 : 


void draw_all(vector<Shape*>& v) 


for(int i= 0; ji<v.size(); ++i) v[i]-—>draw'(); 


} 
它 看 起 来 的 确 是 “ 当然 的 面向 对 象 程序 设计 ”。 它 主要 依赖 类 的 层次 和 虚 函 数 调用 为 每 个 给 定 的 
Shape 找到 正确 的 draw( ) 函数 ; 即 对 一 个 :Cirele,， 它 调用 的 是 Circle :: draw( ) ， 而 对 于 Open_poly- 
line, 它 调用 的 是 Open_polyline :: draw( ) 。 但 vector < Shape ”> 本 质 上 是 一 个 小 型 程序 设计 结构 : 
它 依赖 于 编译 时 解析 的 参数 (元 素 类 型 )。 为 了 强调 这 一 点 , 我 们 再 来 看 一 个 例子 ,用 简单 的 标准 
库 算 法 来 重 写 上 面 的 循环 : 


void draw_all(vector<Shape*>& v) 
{ 


floreachlv.begin0 ,wend0 .mem tun(&Shape: :draw)); 


) . 
for_each( ) 的 第 三 个 参数 是 一 个 函数 ,for_each( ) 会 对 序列 ( 由 前 两 个 参数 指出 ,参见 附录 B. 5. 1) 

中 每 个 元 素 调 用 该 函数 。 现 在 , 第 三 个 函数 调用 被 假定 为 一 个 使 用 fx) 语 法 调用 的 普通 函数 (或 
是 一 个 函数 对 象 ) ， 而 不 是 一 个 使 用 p ->f( ) 语 法 调用 的 成 员 函 数 。 因 此 , 我 们 使 用 标准 库 函 数 
mem_fun( ) (参见 附录 B. 6.2) 表 明 我 们 实际 是 希望 调用 一 个 成 员 函 数 ( 虚 函 数 Shape :: draw( ) ) 。 
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这 里 的 关键 点 在 于 for_each( ) 和 mem_fun( ) 实 际 上 都 是 模板 , 一 点 也 不 “面向 对 象 ”; 它们 明显 属 
于 我 们 通常 所 说 的 泛 型 程序 设计 。 这 里 更 为 有 趣 的 是 ， mem_fun( ) 是 一 个 返回 类 对 象 的 独立 ( 模 
板 ) 函数 。 换 名 话说, 它 也 可 以 轻易 地 被 归 为 普通 的 数据 抽象 风格 ( 非 继 承 性 的 ) 甚至 是 过 程 化 程 
序 设 计 风 格 ( 非 数据 隐藏 ) 。 所 以 , 我 们 可 以 说 这 行 代 码 使 用 了 C++ 支持 的 所 有 4 种 基本 风格 的 
主要 特点 。 

但 为 什么 要 编写 第 二 个 版 本 的 “draw all Shapes” 呢 ? 它 的 功能 与 第 一 个 版 本 基本 相同 , 但 代 
码 反 而 更 长 一 些 ! 我 们 可 以 给 出 的 一 个 理由 是 ; 与 for 相 比 , 用 for_each( ) 表 达 循 环 " 更 显然 而 且 
更 不 容易 出 错 ”。 但 对 于 大 多 数 人 来 讲 , 这 并 不 那么 有 说 服 力 。 还 有 一 种 更 好 的 理由 :“for_each 
( ) 表 示 的 是 要 做 什么 (遍历 序列 ), 而 不 是 怎样 去 做 ”"。 但 是 , 对 大 多 数 开 发 者 来 说 ,“ 有 用 ” 才 更 
具 说 服 力 : 第 二 个 版 本 为 我 们 指出 了 一 种 可 以 用 来 解决 更 多 问题 的 通用 方法 (用 最 好 的 泛 型 程序 
设计 传统 方法 ) 。 为 什 用 vector 而 不 是 list 或 一 般 的 序列 来 保存 形状 呢 ? 因此 , 我 们 可 以 给 出 第 三 
个 版 本 (也 是 更 一 般 的 版 本 ) : 


template<class Iter> void draw _all(lter b lter e) 
{ 

for_each(b,e,mem_fun(&Shape::draw)); 
} 


这 个 版 本 适用 于 所 有 的 形状 序列 。 特 别 是 , 它 甚至 可 以 用 于 Shape 数组 : 
Point p(0,100); 

Point p2(50,50); 

Shape* a[] = { new Circle(p,50), new Triangle(p,p2,Point(25,25)) }; 

draw_all(a,a+2); 


由 于 没有 更 合适 的 术语 , 我 们 称 这 种 最 恰当 地 混合 多 种 风格 的 程序 设计 方式 为 多 范 型 程序 设计 
( multi-paradigm programming) 。 


22. 2 程序 设计 语言 历史 概览 


最 初 的 程序 设计 , 就 是 程序 员 用 手 将 0 和 1 刻 在 石头 上 ! 好 吧 , 事情 并 不 是 这 样 的 , 但 也 差 
不 了 太 多 。 在 本 节 中 , 我 们 将 从 程序 设计 的 (几乎 ) 最 初 阶段 讲 起 , 快速 介绍 一 下 程序 设计 语言 发 
展 历 史 中 与 C++ 程序 设计 相关 的 一 些 主要 进展 。 

已 有 的 程序 设计 语言 实在 太 多 了 。 语 言 以 至 少 每 10 年 2000 种 的 速度 不 断 被 发 明 出 来 , 而 语言 
“死亡 ”的 速度 也 差不多 。 本 节 主 要 介绍 过 去 60 年 中 出 现 的 10 种 语言 , 更 多 信息 请 参考 http://re- 
search. ihost. com/hopl/HOPL. html。 在 这 个 网 站 上 , 你 可 以 找到 三 个 ACM SIGPLAN HOPL( 程 序 设 计 
语言 历史 ，History of Programming Languages) 会议 的 全 部 论文 的 链接 。 这 些 论文 都 是 经 过 全 面 的 同行 
评阅 的 ， 比 一 般 的 网 络 资源 更 加 完整 而 可 信 。 本 节 讨 论 的 语言 都 是 曾 在 HOPL 上 进行 过 报告 的 。 注 
意 ， 如 果 你 在 搜索 引擎 中 输入 一 篇 著名 论文 的 完整 标题 , 你 有 很 大 机 会 找到 论文 的 全 文 。 而 且 , 大 
多 数 计算 机 科学 家 都 有 自己 的 主页 , 你 可 以 在 那里 找到 更 多 的 他 们 的 研究 工作 的 相关 信息 。 

本 章 对 每 一 种 语言 的 介绍 都 很 简短 ,实际 上 每 种 语言 , 包括 本 章 未 提 及 的 数 百 种 语言 ,都 值 
得 用 一 整 本 书 来 介绍 。 每 一 种 的 语言 的 内 容 都 经 过 了 精 挑 细 选 。 我 们 希望 你 能 接受 这 样 一 个 挑 
战 : 对 每 种 语言 努力 学 习 更 多 知识 ， 而 不 是 简单 地 认为 “X 语言 的 全 部 内 容 不 过 如 此 而 已 *! 请 记 
住 , 本 章 介绍 的 每 一 种 语言 都 是 一 个 了 不 起 的 成 就 , 都 曾 为 我 们 的 世界 做 出 过 巨大 的 贡献 。 由 于 
篇 幅 所 限 , 我 们 无 法 更 全 面 地 介绍 这 些 语言 一 一 但 总 比 完全 不 介绍 要 好 。 我 们 本 打算 为 每 一 种 语 
言 都 提供 一 小 段 代码 , 但 很 遗憾 , 在 本 章 中 并 不 适合 这 样 做 (参见 练习 5、6)。 

我 们 见 过 太 多 这 样 的 情况 : 人 们 在 介绍 某 种 人 造 产品 (例如 , 一 种 程序 设计 语言 ) 时 ， 只 是 简 
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单 地 介绍 它 是 什么 , 或 者 介绍 它 是 某 个 无 名 “开发 过 程 " 的 产物 。 这 样 的 介绍 和 在 曲 了 历史 : 通常 
(特别 是 在 形成 早期 ) , 一 种 程序 设计 语言 是 理念 、 职 业 、 个 人 偏好 以 及 外 部 限制 条 件 作 用 在 一 个 
或 (通常 是 ) 多 个 人 身上 的 结果 。 因 此 , 我 们 强调 与 语言 相关 联 的 关键 人 物 。 并 不 是 IJBM、 贝 尔 实 
验 室 、 剑桥 大 学 等 机 构 设 计 了 程序 语言 , 而 是 来 自 这 些 机 构 中 的 人 设计 了 语言 (他 们 通常 与 朋友 
或 同事 合作 完成 ) 。 

请 注意 , 有 一 种 奇怪 的 现象 常常 扭曲 我 们 对 历史 的 看 法 。 我 们 为 那些 著名 的 科学 家 或 工程 师 
树 碑 立 传 之 时 , 都 是 他 们 已 经 功成名就 很 久之 后 一 一 已 经 成 为 国家 科学 院 院士 、 皇 家 学 会 院士 、 
圣 约翰 事 士 、 图 灵 奖 获得 者 等 。 换 句 话 说, 离 他 们 取得 最 重要 的 成 就 的 时 间 已 经 过 去 几 十 年 了 。 
当然 , 几乎 所 有 著名 的 科学 家 和 工程 师 都 是 在 一 生 中 不 断 地 创造 出 专业 成 就 。 但 是 ， 当 你 回 过 头 
去 审视 你 所 喜欢 的 程序 设计 语言 和 程序 设计 技巧 是 如 何 产生 的 时 候 , 你 可 以 试 着 想象 一 下 : 一 个 
年 轻 人 ( 即使 是 现在 , 科学 和 工程 领域 中 的 女性 仍 是 太 少 了 , 因此 假定 是 一 位 男性 ) 正在 试图 计算 
他 是 否 有 足够 的 钞票 请 他 的 女 朋 友 去 一 个 体面 的 餐厅 吃饭 ; 或 者 是 一 位 父亲 正在 考虑 该 将 一 篇 重 
要 的 论文 提交 到 哪个 会 议 上 , 以 便 这 个 年 轻 的 家 庭 能 够 顺便 度 个 假 。 至 于 灰白 的 胡须 、 秃 顶 和 过 
时 的 服装 , 那 都 是 很 久 以 后 的 事情 了 。 
22. 2.1 最早 的 程序 语言 

从 1949 年 开始 ， 当 第 一 代 “ 现 代 ” 储 存 程序 式 电 子 计 算 机 出 现 之 时 , 它们 就 都 具有 自己 的 程 
序 设计 语言 。 那 时 的 每 一 台 计 算 机 都 有 它 自 己 的 语言 。 当 时 , 算法 (例如 , 行星 轨道 的 计算 ) 的 表 
达 和 特定 机 器 的 指令 间 是 一 一 对 应 的 。 显 然 , 科学 家 ( 当时 的 用 户 大 部 分 都 是 科学 家 ) 将 数学 公式 
记 在 笔记 上 , 但 程序 只 是 一 串 机 器 指令 的 列表 。 最 初 的 程序 列表 是 十 进 制 或 八进制 数 一 一 与 计算 
机 内 存 中 的 表示 形式 完全 匹配 。 后 来 , 汇编 器 和 “自动 编码 ”出 现 了 , 即 人 们 发 明了 用 符号 名 称 表 
示 机 器 指令 和 机 器 特性 (如 寄存 器 ) 的 语言 。 这 样 , 程序 员 可 能 写 出 “LD RO 123” 就 可 以 将 内 存 地 
址 123 中 的 内 容 读 取 到 0 号 寄存 器 中 。 但 是 , 每 台 机 器 都 有 自己 的 指令 集 和 语言 。 








如 果 要 选 出 那个 时 代 有 代表 性 的 程序 语言 设计 者 , 剑桥 大 学 计算 机 实验 室 的 David Wheeler 
无 疑 是 当然 的 候选 人 。1948 年 , 他 编写 了 运行 于 储存 程序 式 计算 机 上 的 第 一 个 真正 的 程序 (如 我 
们 在 4.4.2. 1 节 提 到 的 “平方 表 ” 程 序 )。 大 约 有 10 个 人 都 声称 目 己 实 现 了 最 时 的 编译 器 (用 于 编 
译 机 器 相关 的 “自动 编码 ”) ，David Wheeler 是 其 中 之 一 ,他 发 明了 函数 调用 (是 的 ,即使 是 如 此 显 
而 易 见 的 简单 事情 , 也 还 是 需要 某 人 在 某 时 将 它 发 明 出 来 的 )。 在 1951 年 , 他 写 了 一 篇 杰出 的 论 
文 来 介绍 如 何 设 计 库 , 这 篇 论文 的 内 比 那 个 时 代 至 少 超前 了 20 年 ! 他 与 Maurice Wilkes( 在 互联 
网 上 搜索 一 下 他 ) 和 D.J. Gil 合作 完成 了 第 一 本 关于 程序 设计 的 书 ; 他 是 第 一 位 计算 机 科学 专业 
博士 学 位 获得 者 (1951 年 在 剑桥 大 学 ), 后 来 他 的 主要 贡献 在 硬件 领域 (cache 体系 结构 、 早 期 的 局 
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域 网 ) 和 算法 方面 (例如 ,TEA 加 密 算法 (人 参见 25. 5.6 节 ) 和 ”Burrows-Wheelen 续 换 ” (用 于 bap2 中 
的 压缩 算法 ) ) 。David Wheeler 碰巧 还 是 Bjame Stroustrup 的 博士 论文 导师 一 一 计算 机 科学 还 是 一 
门 年 轻 的 学 科 。David Wheeler 的 一 些 最 重要 的 成 就 都 是 在 研究 生 阶段 取得 的 。 他 后 来 继续 在 剑 
桥 大 学 工作 , 成 为 剑桥 大 学 教授 和 皇家 学 会 院士 。 


参考 文献 


Burrows, M., and David Wheeler. “A Block Sorting Lossless Data Compression Algorithm” ‘Technical Report 
124, Digital Equipment Corporation, 1994. 
Bzip2 link: www.bzip.org/. 
Cambridge Ring website: http://koo.corpus.cam.ac.uk/projects/earlyatm/cr82. 
Campbell-Kelly, Martin. “David John Wheeler” Biographical Memoirs of Fellows of the Royal Soniety, Vol. 52, 2006. 
(Flis technical biography:.) 
EDSAC: http://en.wikipedia.org/wiki/EDSAC. 
Knuth, Donald. The Art of Computer Propramming. Addison-Wesley, 1968, and many revisions, Look for Da- 
-vid Wheeler” in the index of each volume. 
TEA link: http://en.wikipedia.org/wiki/Tiny_Encryption_Algorithm. 
Wheeler, D. J. “The Use of Sub-routines in Programmes.” Proceedings of the1952 ACM National Meeting. 
(That’s the library design from 1951.) 
Wilkes, M. V., D. Wheeler, and D. J. Gil Preparation of Proprams for an Electronic Digital Computer. Addison-Wes- 
-ley Press, 1951; 2nd edition, 1957 The first book on programming. 


22. 2.2 现代 程序 设计 语言 的 起 源 
下 面 是 重要 的 早期 程序 设计 语言 的 发 展 历程 ， 





20 世 纪 50 年 代 20 世 纪 60 年 代 20 世 纪 70 年 代 





这 些 程序 设计 语言 的 重要 性 部 分 是 因为 它们 曾经 被 广泛 使 用 (目前 , 在 某 些 情况 下 仍 在 广泛 使 
用 ) , 另 一 个 原因 是 , 它们 是 重要 的 现代 程序 设计 语言 的 祖先 一 一 而 且 通 常 还 是 直接 祖先 , 具有 相 
同 的 名 字 。 在 本 节 中 , 我 们 介绍 三 种 早期 程序 设计 语言 一 一 Fortran、COBOL 和 Lisp, 大 多 数 现代 
程序 语言 的 祖先 都 可 以 追溯 到 这 三 种 语言 。 

22.2.2.1 Fortran 

1956 年 Fortran 的 发 明 可 能 是 程序 设计 语言 发 展 历史 中 最 重要 的 一 步 。“ Fortran” 表示 “公式 
转换 ”( Formula Translation) , 其 基本 思想 是 将 人 类 (而 不 是 机 器 ) 习惯 的 符号 表示 转换 为 高 效 的 机 
器 代码 。Fortran 的 符号 表示 法 是 一 种 适合 于 科学 家 和 工程 师 描 述 问题 数学 求解 方案 的 模型 ,而 不 
是 由 (最 新 的 ) 电子 计算 机 所 提供 的 机 器 指令 。 

以 现代 观点 来 看 ，Fortran 可 以 看 做 对 “用 代码 直接 描述 应 用 领域 "的 首次 尝试 。 它 允许 程序 
员 像 课本 中 那样 书写 线性 代数 公式 。Fortran 提供 了 数组 、 循环 和 标准 的 数学 函数 (使 用 标准 数学 
符号 , 如 x+y 和 sin(x) )。 它 有 一 个 数学 函数 的 标准 库 , 也 提供 了 IO 机 制 , 用 户 还 可 以 自己 定 
义 函 数 和 库 。 

Fortran 所 使 用 的 符号 大 都 是 机 器 无 关 的 ,因此 Fortran 代码 通常 只 需 很 少 改动 就 可 以 从 一 台 
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计算 机 移植 到 另 一 台 计 算 机 上 。 这 在 当时 的 发 展 水 平 上 , 是 一 个 巨大 的 进步 。 因 此 ，Fortran 被 认 
为 是 第 一 个 高 级 程序 设计 语言 。 

Fortran 有 一 个 非常 重要 的 优点 : 由 Fortran 源码 生成 的 机 器 码 可 以 达到 几乎 最 优 的 效率 。 要 
知道 当时 的 计算 机 有 几 个 房间 那么 大 , 并 且 极 其 昂贵 (是 一 个 优秀 的 程序 员 团 队 的 年 薪 总 和 的 许 
多 倍 ) ，( 按 现代 的 标准 ) 它 们 还 慢 得 出 奇 (例如 100 000 条 指令 / 秒 ) , 内存 小 得 可 怜 ( 例 如 8K 字 节 ) 。 
不 过 ,人 们 还 是 能 将 有 用 的 程序 塞 到 这 些 机 器 中 , 因此, 像 Fortran 这 种 符号 描述 方法 上 的 改进 ,如 
果 不 能 保持 高 效率 ,即便 能 大 大 提高 程序 员 的 生产 率 和 程序 的 可 移植 性 , 也 不 会 取得 成 功 。 

Fortran 在 科学 与 工程 计算 这 一 目标 领域 取得 了 巨大 的 成 功 , 并 且 一 直 在 不 断 改进 、 完 善 。 
Fortran 语言 的 主要 版 本 包括 II、 IY、77、90、95、03。 目 前 , 关于 Fortran77 和 Fortran90 谁 应 用 更 广 
泛 的 争论 仍然 在 继续 。 





第 一 个 Fortran 的 定义 和 实现 是 由 IBM 的 John Backus 领导 的 小 组 完成 的 :“ 我 们 不 知道 需要 
什么 以 及 如 何 做 , 从 某 种 程度 上 来 说 , 它 就 是 自然 而 然 地 发 展 起 来 了 。 的 确 , 他 又 如 何 能 知道 呢 ? 
之 前 从 没有 人 做 过 类 似 的 事情 ! 但 是 一 路 走 来 , 他 们 开发 , 或 者 说 发 明了 编译 器 的 基本 结构 : 词 
法 分 析 、 语 法 分 析 、 语 义 分 析 和 优化 。 时 至 今日 , 在 数值 计算 优化 领域 ，Fortran 仍然 处 于 领导 地 
位 。 此 外 ,〈 在 最 初 的 Fortran 之 后 ) 还 出 现 了 一 种 专门 用 于 表示 文法 的 符号 系统 : Backus-Naur 范 
式 (BNF) 。 这 种 方法 在 Algol60( 人 参见 22. 2.3.1 节 ) 中 首次 被 使 用 , 现在 已 经 用 于 大 部 分 现代 程序 
设计 语言 。 在 第 6、7 章 中 , 我 们 也 使 用 了 某 个 版 本 的 BNF 来 描述 文法 。 

很 久之 后 ,John Backus 开辟 了 一 个 全 新 的 程序 设计 语言 分 文 (“ 函数 式 程序 设计 ”)。 与 基于 
读 写 内 存 位 置 的 从 机 器 出 发 的 方式 相反 , 这 种 程序 设计 风格 主张 用 数学 方式 来 编写 程序 。 需 要 注 
意 的 是 , 纯 数学 是 没有 赋值 的 概念 的 , 甚至 连 操作 的 概念 也 没有 。 纯 数学 只 是 在 一 组 给 定 的 条 件 
下 ,“ 简 单 地 ”声明 什么 肯定 是 真 的 。 函 数 式 程序 设计 的 思想 部 分 源 于 Lisp (参见 22.2.2.3 节 )， 
一 些 陋 数 式 程序 设计 的 思想 也 反映 在 STL 中 (参见 第 21 章 ) 。 


参考 文献 


Backus, John. “Can Programming Be Liberated from the von Neumann Style?™” Communications of the ACM, 1977. 
(His Turing award lecture.) 
Backus, John. “The History of FORTRAN 1, 11, and III ACM SIGPLAN Notices, Vol. 13 No. 8, 1978. 
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Hutton, Graham. Proegramming in Haskell. Cambridge University Press, 2007. ISBN 0521692695. 


ISO/IEC 1539. Programming Languages 一 Fortran. (The “Fortran 95 standard.) 
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22.2.2.2 COBOL 

COBOL( 面向 商业 的 通用 语言 ,The Common Business-Oriented Language) 曾 是 面向 商业 应 用 程 
序 员 的 主要 语言 ( 目前 在 某 些 情 况 下 仍然 是 ) ,就 像 Fortran 曾 是 面向 科学 应 用 程序 员 的 主要 语言 
(目前 在 某 些 情况 下 仍然 是 ) 一 样 。COBOL 主要 用 于 数据 处 理 : 

。 数据 复制 

。 数据 存储 和 检索 (如 记 账 ) 

e。 打印 (如 报表 ) 
计算 被 看 做 小 事 ( 在 COBOL 的 核心 应 用 领域 通常 是 这 样 的 ) 。 人 们 期 望 /宣称 COBOL 是 如 此 接近 

“商务 英语 ”, 连 管理 人 员 都 很 可 能 用 它 来 编程 ,从 而 很 快 就 会 使 程序 员 变 得 多 余 。 这 是 那些 热衷 

于 削减 程序 设计 开支 的 经 理 的 良好 愿望 , 但 从 来 没有 实现 , 哪怕 接近 实现 。 z 

COBOL 最 初 是 由 一 个 委员 会 (CODASYL) 在 1959 ~ 1960 年 设计 的 , 这 个 委员 会 是 由 美国 国防 
部 和 一 些 主要 的 计算 机 制造 商 发 起 的 , 其 目的 是 解决 商业 计算 的 需求 。COBOL 的 设计 直接 以 
Grace Hopper 发 明 的 FLOW-MATIC 语言 为 基础 。 她 的 贡献 之 一 就 是 使 用 了 一 种 与 秽语 十 分 接近 的 
语法 (与 之 相对 的 是 由 Fortran 开创 的 使 用 数学 符号 的 语法 , 目前 仍然 占据 主导 地 位 )。 与 Fortran 
以 及 其 他 所 有 成 功 的 语言 一 样 , COBOL 也 历经 不 新 的 演化 和 发 展 , 其 主要 的 版 本 包括 60、61、65、 
68、70、80、90 和 04。 z z 

Grace Murray Hopper 拥有 慎重 大 学 的 数学 博士 学 位 。 在 第 二 次 世界 大 战 期 间 她 为 美国 海军 工 
作 , 研究 最 早期 的 计算 机 。 在 (早期 的 ) 计算 机 工业 界 工 作 了 几 年 后 , 她 又 回 到 了 海军 。 





“海军 少将 Grace Muray Hopper 博士 (美国 海军 ) 在 早期 的 计算 机 程序 设计 领域 做 出 了 杰出 的 
贡献 。 她 将 软件 开发 思想 的 研究 作为 一 生 的 事业 , 作为 这 个 领域 的 领路 人 ,是 她 引领 了 从 原始 的 
全 她 坚信 我 们 原来 就 是 这 人 么 做 的 "不 是 继续 这 人 么 做 的 必 
然 理 由 。 





Anita Borg 1994 年 。 Grace Celebration of Women in Computing” 会 议 上 的 发 言 
Grace Murray Hopper 一 直 被 认为 是 第 一 个 将 计算 机 中 的 错误 称 为 _ bug 的 人 。 她 无 疑 是 最 里 
使 用 这 一 术语 并 且 在 文档 中 对 此 进行 了 记载 的 人 : 
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我 们 可 以 看 到 , 这 是 一 只 真正 的 虫子 (一 只 飞 蛾 ), 它 直 接 引 起 了 一 个 硬件 故障 。 但 是 现代 计算 机 
故障 多 为 软件 故障 , 很 少 能 如 此 生动 地 呈现 出 来 。 


参考 文献 


A biography of G. M. Hopper: http://tergestesoft.com/ ~eddysworld/hopper.htm. 

ISO/IEC 1989:2002. hformation Technology - Programming Languages - COBOL. 

Sammet, Jean E. “The Early History of COBOL.” ACM SIGPLAN Notices, Vol. 13 No. 8, 1978. Special Issue: 
History of Programming Languages Conference. 


22.2.2.3 Lisp 

Lisp 最 初 是 John McCarthy 1958 年 在 麻 省 理工 学 院 设计 的 一 种 语言 , 主要 用 于 链表 和 和 符号 处 
理 ( 也 因此 而 得 名 ，LISt Processing)。 与 编译 型 语言 不 同 , 最 初 的 Lisp 是 解释 型 语言 (现在 通常 也 
是 ) 。Lisp 有 几 十 种 (可 能 更 多 , 有 几 百 种 ) 方 言 。 实 际 上 ， 人 们 经 常 说 “Lisp 默认 就 是 复数 " 。 目 
前 最 流行 的 版 本 是 Common Lisp 和 Scheme。 这 种 语言 曾经 是 (现在 也 是 ) 人工 智能 领域 研究 的 支柱 
(虽然 发 布 的 产品 通常 是 用 C 或 者 C++ 实现 的 ) 。Lisp 最 主要 的 灵感 源泉 是 和 演算 (的 数学 思想 ) 。 

在 各 自 的 应 用 领域 中 ，Fortran 和 COBOL 的 设计 目标 都 是 为 了 解决 现实 世界 中 的 问题 。 而 
Lisp 社区 则 更 加 关注 程序 设计 本 身 和 程序 的 优雅 性 。 通 常 这 些 努 力 都 很 成 功 。Lisp 是 第 一 种 将 自 
身 定 义 与 硬件 分 离 的 语言 ,也 是 第 一 种 将 语义 建立 在 某 种 数学 形式 之 上 的 语言 。 如 果 说 Lisp 有 一 
个 特定 应 用 领域 的 话 , 也 很 难 给 出 其 准确 定义 :“ 人工 智能 ”或 者 “符号 计算 ”都 不 像 “ 商 业 处 理 ” 
和 “科学 计算 ”那样 能 清楚 地 对 应 到 某 种 普通 日 常 工作 。 在 很 多 现代 语言 , 尤其 是 函数 式 语言 中 都 
能 发 现 来 自 Lisp( 或 来 自 Lisp 社区 ) 的 设计 理念 。 











John McCarthy 在 加 州 理工 学 院 获 得 数学 学 士 学 位 , 在 普林斯顿 大 学 获得 数学 博士 学 位 。 你 可 
能 已 经 注意 到 了 , 很 多 程序 语言 的 设计 者 都 来 自 数学 专业 。 在 麻 省 理工 学 院 完成 了 他 载 人 史册 的 
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工作 后 ,McCarthy 于 1962 年 来 到 斯 坦 福 大 学 , 参与 建立 了 斯 坦 福 人 工 智 能 实验 室 。 他 被 公认 为 人 
工 智 能 一 词 的 发 明 人 , 并 在 这 一 领域 做 出 了 许多 贡献 。 
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22. 2.3 Algol 家 族 

在 20 世纪 50 年 代 后 期 , 许多 人 认为 程序 设计 变 得 过 于 复杂 、 专用、 不 科学 。 人 们 还 觉得 程 
序 设计 语言 的 种 类 过 于 繁多 , 而 且 这 些 语言 的 组 合 既 没 有 充分 考虑 通用 性 , 也 没有 坚实 的 理论 基 
础 。 从 那 时 起 , 这 种 质疑 的 观点 多 次 被 提 及 , 但 真正 的 改变 来 自 IFIP( 国际 信息 处 理 联合 会 , the 
International Federation of Information Processing ) 支持 的 一 个 工作 组 。 在 短 短 几 年 时 间 内 ， 他 们 创立 
了 一 种 锋 新 的 程序 设计 语言 。 这 种 语言 Peta 言及 其 定义 的 认识 。 多 数 的 
现代 程序 设计 语言 , 包括 C++ , 都 曾 从 中 受 

22.2.3.1 Alogl60 

Algol( ALGOrithmic Language ) 是 由 IFIP 2. 1 工作 组 设计 的 , 是 对 现代 程序 设计 语言 概念 的 重 


。 词法 作用 域 

。 使 用 文法 定义 语言 

。 语法 和 语义 规则 明确 分 离 

。 语言 定义 和 实现 明确 分 离 

。 系统 化 地 使 用 (静态 , 即 编译 时 ) 类 型 

。 直接 支持 结构 化 编程 
“通用 编程 语言 "的 理念 就 源 于 Algol。 在 它 之 前 , 程序 设计 语言 都 是 专门 服务 于 科学 (如 Fortran) 、 
商业 (如 COBOL) 、 表 处 理 (如 Lisp) 、 仿 真 等 的 。 在 这 些 语言 中 , 与 Algol60 最 接近 的 是 Fortran。 

不 幸 的 是 ，Algol60 的 广泛 使 用 从 未 走出 学 术 领 域 。 因 为 很 多 工业 界 人 士 认 为 它 “ 过 于 古怪 ”， 
Fortran 程序 员 认 为 它 “ 太 慢 ”，COBOL 程序 员 认 为 它 “ 对 商业 处 理 的 支持 不 足 ”，Lisp 程序 员 认 为 
它 “ 不 够 灵活 ”, 大 多 数 工 业界 人 士 (包括 控制 程序 设计 工具 投资 的 经 理 ) 认 为 它 “ 太 学 院 派 ”, 很 
多 美国 人 认为 它 “ 太 欧洲 ”。 多 数 的 批评 是 正确 的 , 例如，Algol60 报告 中 没有 定义 任何 IO 机 制 ! 
但 是 , 同时 代 的 其 他 语言 也 存在 类 似 的 问题 ， ， 不 能 因此 而 否定 Nol 语言 的 重要 地 位 ，Algol 为 很 
多 领域 定 下 了 新 的 标准 。 

Algol60 的 一 个 问题 是 没 人 知道 如 何 实现 它 区 号 由 Peter Naur( Algol60 报告 的 编写 者 ) 和 Edsger 
Dijkstra 领导 的 程序 员 团 队 解决 了 这 一 问题 。 

Peter Naur 就 读 于 哥本哈根 大 学 (学 习 天 文 ) ,随后 在 哥本哈根 理工 大 学 (DTH) 工作 , 并 为 丹 
麦 计算 机 制造 商 Regnecentralen 工作 。 他 最 早 接触 程序 设计 是 在 (1950 ~ 1951 年 ) 在 英国 剑桥 大 学 
计算 机 实验 室 ( 当时 丹麦 还 没有 计算 机 ) , 之 后 他 在 这 个 领域 的 杰出 贡献 跨越 了 学 术 界 和 工业 界 。 
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他 是 Backus-Naur 范式 的 共同 发 明 人 , 也 是 最 早 提议 对 程序 进行 形式 化 推理 的 人 (大约 在 1971 年 ， 
Bjame Stroustrup 从 Peter Naur 的 学 术 论 文中 第 一 次 接触 到 了 不 变 式 的 使 用 ) 。Naur 从 未 停止 对 计 
算 科学 前 景 的 思考 , 一 直 在 关注 程序 设计 中 人 的 因素 。 事 实 上 , 他 后 期 的 研究 工作 已 经 可 以 归 为 
哲学 范畴 了 (除了 他 认为 传统 的 学 院 派 哲学 毫 无 意义 )。 他 是 哥本哈根 大 学 第 一 位 Datalogi 教授 
(datalogi 是 丹麦 语 , 最 好 翻译 为 “informatics”, 信息 学 ; Peter Naur 非常 不 喜欢 “计算 机 科学 ”( com- 
puter science) 一 词 ， 认 为 这 是 彻底 的 用 词 不 当 , 因为 他 并 不 认为 “计算 ” 指 的 就 是 “计算 机 ”)。 








Edsger Dijkstra 是 另 一 位 史上 上 
关 的 工作 是 在 阿姆斯特丹 数学 中 心 进行 的 。 他 后 来 又 在 很 多 地 方 工作 过 , 包括 埃 因 上 霍 温 理工 大 
学 、 宝 来 公司 和 得 州 大 学 奥斯汀 分 校 。 除 了 Algol 语言 方面 的 杰出 工作 外 , 他 还 是 利用 数学 逻辑 
研究 程序 设计 和 算法 的 先驱 和 积极 倡导 者 ,此 外 还 是 THE 操作 系统 设计 者 和 实现 者 之 一 。THE 
是 最 早 的 具有 系统 化 处 理 并 发 操作 能 力 的 操作 系统 之 一 。THE 表示 “Technische Hogeschool Eind- 
Edsger Dijkstra 当时 工作 的 大 学 。 他 的 最 著名 的 论文 “Go-To Statement Considered Harm- 
ful”, 邻 人 信服 地 阐述 了 非 结 构 化 控制 流 所 存在 的 问题 。 

Algol 家 族 树 如 下 所 示 : 





hoven” 





注意 ，Simula67 和 Pascal 这 两 种 语言 是 很 多 (几乎 是 所 有 的 ) 现 代 语 言 的 祖先 。 
参考 文献 z : 


Dijkstra, Edsger W. “Algol 60 ‘Translation: An Algol 60 ‘Translator for the xl and Making a ‘Translator for Algo 
60” Report MR 35/61. Mathematisch Centrum (Amsterdam), 1961. 


~ Dijkstra, Edsger. “Go:1ob Statement Considered Harmful” Communications of the ACM, Vol. 11 No. 3, 1968. 
Lindsey, C. H. “The History of Algol68” Proceedings of the ACM History of Programming Languages 
Conference (HOPL-2). ACM SIGPLAN Notices, Vol. 28 No. 3, 1993. 
Naun Peter, ed. “Revised Report on the Algorithmic Language Algol 60” A/S Regnecentralen (Copenhagen), 
”1964. 
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Naur, Peter. “Proof of Algorithms by General Snapshots” BIT, Vol. 6, 1966, pp. OIG Probablythe first papel 
on how to prove programs correct. 

Naur, Peter “The European Side of the Last Phase of the Development of ALGOL 60” ACM SIGP- 
LAN Notices, Vol 13 No. 8, 1978. Special Issue: History of Programming Languages Conferenee. 

Perlis, Alan J. “The American Side of the Development of Algol” ACM SIGPLAN Notices, Vol. 13 No. 8， 
1978. Special Issue: History of Programming Languages Conference. 


van Wingaarden, A., B. J. Mailloux, J. E. L. Peck, C, H. A. Koster, M. Sintzoff, C. H. Lindsey, L. G. L. T. 


Meertens, and R. G. Fisker, eds. Revised Report on the Aleoritlonic Language Alev! 68(Sept. 1973). Springer-Verlag, 
1976. 


22.2.3.2 Pascal 


在 Algol 家 族 树 中 ，Algol68 语言 是 一 个 巨大 、 雄心 动 动 的 项 目 。 像 Algol60 一 样 , 它 也 是 由 
“Algol 委员 会 "(IFIP 工作 组 2. 1) 负 责 。 但 是 看 上 去 它 “ 永 远 ” 也 不 能 完成 , 以 至 于 很 多 人 失去 了 
耐心 ,并 怀疑 这 样 一 个 项 目 所 产生 的 成 果 是 否 真 的 有 用 。Algol 委员 会 的 一 个 成 员 一 一 Niklaus 
Wirth , 决定 设计 、 实现 自己 的 语言 。 这 就 是 Pascal, 它 也 是 源 于 Algol, 但 与 Algol68 不 同 , 它 是 Al- 
gol60 的 简化 。 

Pascal 于 1970 年 完成 , 它 确实 很 简单 带 来 的 一 个 后 果 就 是 不 够 灵活 。 人 们 一 般 认 为 它 只 适 
合 教学 , 但 早期 的 相关 论文 都 把 它 描述 为 Fortran 的 替代 品 , 用 于 当时 的 超级 计算 机 。Pascal 确实 
非常 容易 学 习 , 并 且 随 着 一 个 可 移植 性 极 好 的 版 本 的 实现 , 它 逐 渐 成 为 一 种 十 分 流行 的 教学 语 
言 , 但 实践 证 明 它 没有 对 Fortran 造成 任何 威胁 。 





Pascal 是 瑞士 苏黎世 联邦 理工 学 院 (ETH) 的 Niklaus Wirth 教授 (上 面 的 照片 分 别 是 1969 年 和 
2004 年 拍摄 的 ) 的 杰作 。 他 在 加 州 大 学 伯克利 分 校 获得 了 电子 工程 和 计算 机 科学 博士 学 位 , 并 和 
加 州 有 着 终生 的 不 解 之 缘 。 如 果 说 要 推选 一 位 程序 语言 设计 终极 专家 的 话 ，Wirth 教授 是 这 个 世 
界 上 最 配 得 上 这 个 称号 的 人 。 在 25 年 时 间 里 ， 他 设计 和 实现 了 下 列 语言 : 

® Algol W 
PL/360 
@ Euler 
® Pascal 
es Modula 
Modula-2 
Oberon 
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e Oberon-2 

e Lola( _ 种 硬件 描述 语言 z 
Niklaus Wirth 把 这 些 工作 当做 对 简洁 性 的 无 止境 的 追求 。 他 的 工作 对 这 个 领域 产生 了 巨大 的 影 
响 。 学 习 这 一 系列 语言 是 一 种 非常 有 趣 的 练习 。Wirth 教授 是 唯一 在 HOPL 会 议 上 提出 过 两 种 语 
言 人 。 

最 终 , 纯粹 的 Pascal 被 证 明 对 于 工业 界 来 说 太 简 单 、 太 严格 了 。20 世纪 80 年 代 , 主要 是 在 
Anders Hejlsberg 的 努力 下 , 将 Pascal 从 消亡 的 边缘 拉 了 回来 。Anders Hejlsberg 是 Borland 的 三 位 
创始 人 之 一 。 最 初 他 设计 并 实现 了 Turbo Pascal (与 其 他 实现 相 比 ， 有 着 更 加 灵活 的 参数 传递 机 
制 ) ， 后 来 又 设计 了 类 似 C++ 的 对 象 模型 (但 是 仅 有 单一 继 革 ,并 有 更 好 的 模块 机 制 ) 。 他 就 读 于 
哥本哈根 理工 大 学 (Peter Naur 曾 工作 过 的 地 方 ) 一 一 世界 有 时 真 的 是 很 小 啊 。Anders Hejlsberg 后 
来 为 Borland 设计 了 Delphi 语言 ,为 微软 设计 了 C 和 护理 言 。 

Pascal 家 族 树 (经 过 必要 的 简化 后 ) 如 下 所 示 : 





参考 文献 


Borland/Turbo Pascal. http://en.wikipedia.org/wiki/ Turbo_Pascal. 


Hejlsberg, Anders, Scott Wiltamuth, and Peter Golde. The C# .Progranvning Language,. Second Edition. Microsoft .NET 
Development Series. ISBN 0321334434. 


Wirth, Niklaus. “The Programming Language Pascal” Ada bformatics,. Vol. 1 Fasc 1, 1971. 
Wirth, Niklaus. “Design and TImplementation of Modula.” Soffware~Practice and. Experience, Vol. 7 No. 1, 1977. 


Wirth, Niklaus. “Recollections about the Development of Pascal’” Proceedings of the ACM History of Prog- 
ramming Languages Conference (HOPL2). ACM SIGPLAN Notices, Vol. 28 No. 3, 1993. 


Wirth, Niklaus. Modula-2 and Oberon. Proceedings of the Third ACM SIGPLAN Conference on the History 
of Programming Languages (HOPL-IIT). Sar Diego, CA, 2007. http: /portal. acm.org/toc.cftm2d=]1238844. 


22.2.3.3 Ada : 

Ada 语言 是 为 美国 国防 部 专门 设计 的 。 特 别 是 , 它 是 一 种 适合 于 为 艇 人 式 系统 编写 可 靠 、 可 
维护 程序 的 语言 。 它 的 最 明显 的 祖先 是 Pascal 和 Simula( 参见 22. 2.6 节 ) 。Ada 设计 小 组 的 领导 
人 是 Jean Ichbiah 一 一 他 曾经 是 Simula 用 户 组 的 主席 。Ada 的 设计 强调 ， 

e 数据 抽象 (但 直到 1995 才 引 入 继承 机 制 ) 

。 强 大 的 静态 类 型 检查 

。 语言 直接 支持 并 发 性 
Ada 的 设计 目标 是 希望 在 程序 设计 语言 中 体现 软件 工程 思想 。 其 结果 就 是 , 美国 国防 部 设计 出 的 
不 是 一 门 语言 , 而 是 设计 语言 的 一 套 详细 流程 。 众 多 的 人 和 组 织 都 对 此 做 出 了 贡献 ,整个 项 目 是 
通过 一 系列 的 竞赛 来 推进 的 , 首先 是 评选 出 最 佳 的 语言 规范 , 随后 就 是 设计 能 体现 出 最 佳 规范 思 
想 的 最 佳 语言 。 这 个 长 达 20 多 年 的 巨大 项 目 (1975 ~ 1998 年 ) 从 1980 年 开始 由 AJPO( Ada Joint 
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Program Office，Ada 联合 计划 组 织 ) 负责 管理 。 

在 1979 年 , 语言 设计 完成 , 并 以 Augusta Ada Lovelace 女士 (著名 诗人 拜 伦 勋 事 的 女儿 ) 的 名 
字 命 名 。Lovelace 女士 被 认为 是 第 一 位 现代 程序 员 ( 当然 , 这 里 “现代 ”的 定义 很 宽泛 ) ， 因 为 她 在 
19 世纪 40 年 代 曾 和 Charles Babbage( 剑桥 大 学 的 卢 卡 斯 数学 教授 一 一 牛顿 曾经 担任 过 这 一 职位 ) 
一 起 工作 , 研究 一 种 革命 性 的 机 械 式 计算 机 。 不 幸 的 是 ，Babbage 的 机 器 没 能 成 功 地 成 为 一 个 实 
用 工具 。 





正 是 因为 其 设计 遵循 了 详尽 的 流程 ，Ada 被 认为 是 终极 的 “委员 会 设计 ”语言 。 作 为 最 终 赢 
得 胜利 的 设计 团队 的 领导 者 , 来 自 法 国 Honeywell Bull 公司 的 Jean Ichbiah 却 强烈 地 否认 这 一 
点 。 然 而 , 我 猜测 (基于 和 他 的 讨论 ) ,如 果 没 有 这 个 详细 流程 的 束缚 , 他 本 可 以 设计 出 更 好 的 
语言 。 

Ada 被 美国 国防 部 确定 为 军事 应 应 用 程序 强制 使 用 语言 已 经 有 很 多 年 历史 了 , 以 至 于 有 这 样 的 
说 法 ,“Ada 不 仅仅 是 一 个 好 的 思想 , 更 是 一 项 法 律 ”"! 最 初 , Ada 只 是 “强制 "使 用 而 已 , 但 随 着 
许多 项 目 获 得 “ 移 免 权 ” 来 使 用 其 他 语言 (通常 是 C++ ) , 美国 国会 通过 了 一 项 法 律 , 要 求 大 多 数 
军事 应 用 程序 必须 使 用 Ada。 后 来 , 这 一 法 律 由 于 所 面 对 的 商业 和 技术 上 的 现实 问题 ,不 得 不 废 
除了 。Bjarne Stroustrup 是 极 少数 工作 成 果 曾 被 美国 国会 禁止 的 人 之 一 。 

我 们 坚信 , 与 它 获得 的 声誉 相 比 ，Ada 实际 上 要 好 得 多 。 假 如 美国 国防 部 不 那么 强硬 地 推 
广 Ada, 而 且 能 够 正确 应 用 它 的 话 ( 用 做 开发 过 程 、 软 件 开发 工具 、 文 档 等 的 标准 ), 它 也 许 会 
成 功 得 多 。 直到 现在 ， a dd 
语言 。 

Ada 在 1980 年 成 为 军事 标准 ， 1983 年 成 为 ANSIL 标 准 ( 第 一 个 Ada 实现 在 1983 年 完成 一 一 在 
第 一 个 标准 完成 之 后 三 年 ) ，1987 年 成 为 ISO 标准 。 这 个 ISO 标准 在 1995 年 被 全 面 地 ( 当然 在 保 
证 兼容 性 的 前 提 下 ) 进行 了 修订 。 重 要 的 改进 包括 更 灵活 的 并 发 机 制 以 及 支持 继承 。 
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History of Programming Languages Conference (HOPL-2). ACM SIGPLAN Notices, Vol 28 No. 3, 1993. 
22.2.4 Simula 


20 世纪 60 年 代 中 期 ，Kristen Nygaard 和 Ole-Johan Dahl 设计 了 Simula， 当时 他 们 在 挪威 计算 
中 心 和 奥斯陆 大 学 工作 。Simula 毫 无 疑问 是 Algol 语言 家 族 的 成 员 。 实 际 上 ，Simula 几乎 就 是 Al- 
gol60 的 超 集 。 但 是 , 我 们 选择 单独 对 Simula 进行 介绍 , 这 是 因为 现在 人 们 所 说 的 “面向 对 象 程序 
设计 ”的 大 多 数 基 本 思想 都 来 自 Smula。 它 是 第 一 种 提供 继承 和 虚 苯 数 机 制 的 语言 。 术 语 类 
(class) 表示 “用 户 自 定义 类 型 "和 虚 函 数 (virtual function ) 表示 可 以 履 盖 并 可 通过 基 类 接口 调用 的 
曙 数 , 都 来 源 于 Simula。 

Simula 的 贡献 并 不 局 限于 语言 方面 ， 它 更 重要 的 贡献 是 提出 了 明确 的 面向 对 象 设计 的 概念 ， 
这 基于 用 代码 来 建 模 现实 世界 现象 的 思路 ; 

。 用 类 和 类 对 象 表示 思想 。 

。 用 类 层次 (继承 ) 表 示 层 次 关系 。 

因此 , 程序 变 成 一 组 相互 作用 的 对 象 , 而 不 是 单个 的 庞然大物 。 





Kristen Nygaard 是 Simula 的 共同 发 明 人 ( 另 一 位 是 Ole-Johan :Dahl, 照片 中 左 侧 戴 眼镜 者 ), 他 
在 很 多 方面 都 堪 称 巨人 (包括 身高 ), 他 的 热情 和 慷慨 也 完全 配 得 上 这 样 的 声誉 。 他 构思 了 面向 对 
象 编 程 和 设计 (特别 是 继承 ) 的 基本 思想 , 并 在 此 后 的 几 十 年 间 不 断 探 索 这 些 思想 的 含义 。 他 从 不 
满足 于 简单 、 短 期 和 短视 的 答案 。 他 还 数 十 年 如 一 日 地 积极 投身 到 社会 活动 中 。 如 果 挪 威 不 是 置 
身 于 欧盟 之 外 的 话 , 他 本 应 获得 更 高 的 声望 。 但 他 认为 殖 盟 有 可 能 成 为 一 个 中 央 集 权 和 官僚 主 
义 的 眶 梦 般 的 机 构 , 它 不 会 关心 挪威 这 样 的 边缘 小 国 的 需求 。20 世纪 70 年 代 中 期 ，Kristen 
Nygaard 花 了 大 量 时 间 在 丹麦 奥 尔 胡 斯 大 学 的 计算 机 科学 系 (: 当 时 ，Bjarne Stroustrup 在 那里 攻读 
硕士 学 位 ) 。 

Kristen Nygaard 在 奥斯陆 大 学 获得 数学 硕士 学 位 。 他 在 2002 年 去 世 , 就 在 他 即将 (与 他 终生 
的 朋友 Ole-Johan Dahl 一 起 ) 获 得 ACM 图 灵 奖 之 前 的 一 个 月 , 这 个 奖项 对 计算 机 科学 家 来 说 是 最 
高 的 荣誉 。 

Ole-Johan Dahl 是 一 位 更 传统 的 学 者 。 他 的 研究 兴趣 主要 集中 在 语言 规范 和 形式 化 方法 方面 。 
1968 年 ， 他 成 为 奥斯陆 大 学 第 一 位 信息 学 (计算 机 科学 ) 全 职 教授 。 

2000 年 8 月 , Dahl 和 Nygaard 被 挪威 国王 授予 圣 奥 拉 夫 高 级 骑士 勋章 。 在 他 们 的 家 乡 ， 纯粹 
的 计算 机 技术 人 员 才 能 获得 如 此 高 的 荣誉 ! | 
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22.2.5 C 


在 1970 年, 一 件 “ 众 所 周知 ”的 事情 是 , 重要 系统 的 程序 设计 一 一 特别 是 操作 系统 的 实现 , 必 
须 使 用 汇编 语言 ,从 而 不 具备 可 移植 性 。 这 与 Fortran 出 现 之 前 科学 计算 程序 设计 的 处 境 很 相像 。 
一 些 个 人 和 组 织 开 始 着 手 挑战 这 个 成 见 , 最 终 , C 语言 (参见 第 27 章 ) 成 为 这 些 工作 中 的 最 成 
功 者 。 

”Dennis Ritchie 在 位 于 新 泽 西 州 茉 莉 山 的 贝尔 电话 实验 室 计算 科学 研究 中 心 设计 并 实现 了 C 
语言 。'C 的 魅力 在 于 它 是 一 种 简单 的 编程 语言 ,而 这 种 简单 性 是 慎重 规划 后 的 结果 , 而 且 C 语言 
与 便 件 的 基本 特性 关联 非常 紧密 。 目 前 C 语言 版 本 的 复杂 性 (其 中 大 多 数 出 于 兼容 性 考虑 也 出 现 
在 了 C++ 中 ) 大 多 数 是 在 Dennis Ritchie 的 最 初 设 计 之 后 添加 进来 的 , 并 且 有 某 些 情况 并 不 符合 
他 的 原意 。C 的 成 功 部 分 是 因为 很 早 就 被 广泛 使 用 , 但 它 真 正 的 强大 之 处 在 于 语言 特性 到 硬件 设 
施 直 接 映射 (参见 25.4 ~25.5 节 )。Dennis Ritchie 曾 简单 地 将 C 描述 为 “一 种 强 类 型 、 弱 检查 的 语 
言 ”; 也 就 是 说 , C 是 一 种 静态 (编译 态 ) 类 型 的 系统 , 在 程序 中 不 按 对 象 定义 的 方式 使 用 它 是 非法 
的 一 一 但 C 编译 器 又 不 会 检查 这 种 问题 。 但 当 资源 有 限 , 如 内 存 只 有 48K 字 节 时 , 这 样 做 可 以 得 
到 更 简短 的 代码 , 还 是 有 意义 的 。 在 C 投入 应 用 后 不 久 ， I 一 种 称 为 lint 的 程序 , 它 将 
类 型 系统 验证 从 编译 器 中 分 离 出 来 。 

Dennis Ritchie 与 Ken Thompson 一 起 发 明了 UNIX ， 它 无 疑 都 是 最 有 影响 力 的 操作 系 统 。(f 一 
直 都 与 UNIX 操作 系统 紧密 联系 在 一 起 。 近 年 来 , 又 与 Linux 和 开源 项 目的 发 展 紧密 相连 。 

在 为 贝尔 实验 室 计 算 机 科学 研究 中 心 工 作 了 40 年 之 后 ，Dennis Ritchie 现在 已 经 从 朗讯 公司 
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贝尔 实验 室 退 休 了 。 他 在 哈佛 大 学 获得 物理 学 学 士 学 位 和 应 用 数学 博士 学 位 。 





在 1974 ~1979 年 间 ，Bell 实验 室 中 的 很 多 人 都 对 C 的 设计 和 应 用 产生 过 影响 。Doug Mcllroy 
是 所 有 人 都 喜欢 的 评论 家 、 讨 论 伙 伴 和 创意 丰富 的 人 。 他 影响 了 C、C++ 、UNIX 和 其 他 很 多 研究 
工作 。 








由 Ee 


Brian Kernighan 是 一 位 杰出 的 程序 员 和 作家 。 
格 就 部 分 来 源 于 他 的 杰作 《The C Programming Language》( Brian Kernighan 和 Dennis Ritchie 合 著 ， 
因而 被 称 为 “K&R”) 中 指南 那 部 分 。 

仅 有 好 的 思想 是 不 够 的 ; 为 了 能 被 更 大 范围 的 人 们 所 用 , 应 该 将 这 些 思 想 归 约 到 最 简单 的 形 
式 , 并 以 目标 读者 群 中 更 多 人 能 够 接受 的 方式 闹 述 清楚 。 在 表达 思想 时 , 元 长 鹃 哑 是 最 可 怕 的 政 
人 ,同样 可 怕 的 还 有 模糊 和 过 度 简化 。 纯 粹 主义 者 经 常 嘲笑 这 种 大 众 化 的 努力 方向 , 他 们 喜欢 将 
“原始 结果 ”以 一 种 只 有 专家 才能 理解 的 方式 表达 出 来 。 我 们 的 理念 与 他 们 不 同 : 将 不 平凡 的 、 有 
价值 的 思想 灌输 到 初学 者 的 头脑 中 是 一 件 很 困难 的 事情 , 对 于 提高 我 们 的 专业 水 准 是 很 有 帮助 
的 , 也 能 最 大 程度 为 社会 做 出 贡献 。 | 。 

多 年 以 来 ，Brian Kemighan 参与 了 很 多 有 影 啊 的 程序 设计 和 出 版 项 目 。 两 个 典型 例子 是 
AWK 一 一 一 种 早期 的 脚本 语言 ,用 作者 名 字 的 首 字母 命名 ( Aho、Weinberger 和 Kernighan) ， 以 及 
AMPL( A Mathematical Programming Language ,数学 编程 语言 ) 。 

目前 , Brian Kemighan 是 普林斯顿 大 学 的 教授 ; 他 是 一 位 优秀 的 教师 , 擅长 于 将 复杂 问题 讲 得 
清晰 易 懂 。 他 为 贝尔 实验 室 计 算 机 科学 研究 中 心 工作 了 超过 30 年。 贝尔 实验 室 后 来 更 名 为 
AT&T 贝尔 实验 室 ,: 然 后 又 被 拆 分 为 AT&T 实验 室 和 朗讯 贝尔 实验 室 。 他 在 多 伦 多 大 学 获得 了 物 
理学 学 士 学 位 , 在 普林斯顿 大 学 获得 了 电子 工程 博士 学 位 。 
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C 语言 的 家 族 树 结构 如 下 图 : 





im Richands, 
Ca 1967 
on Strachey, 
Cambridge, mi 


mid-1960s 

C 源 于 三 种 语言 : 英国 的 一 直 未 完成 的 项 目 CPL; Martin Richards 离开 剑桥 大 学 访问 麻 省 理工 
学 院 时 设计 的 BCPL( Basic CPL) 语 言 ; 以 及 由 Ken Thompson 设计 的 称 为 B 的 解释 型 语言 。 后 来 ， 
C 制订 了 ANSI 和 IS0 标准 , 并 有 很 多 特性 受到 了 C++ 的 影响 (如 函数 参数 检查 和 const) 。 

CPL 是 剑桥 大 学 和 伦敦 的 帝国 理工 学 院 的 合作 项 目 。 这 个 项 目 最 初 是 在 剑桥 大 学 进行 的 ， 因 
此 “C” 的 正式 含义 是 “剑桥 ”( Cambridge) 。 当 帝国 理工 学 院 参与 进来 后 ,“C "的 正式 含义 就 变 为 
“联合 《Combined) 。 实 际 上 (我 们 常常 听 说 的 ) 它 一 直 就 表示 “Christopher”， 即 CPL 的 主要 设计 
者 Christopher Strachey 。 
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22.2.6 CG++ 


C++ 是 一 种 偏 回 于 系统 编程 的 通用 程序 设计 语言 , 它 的 特点 是 ; 

e 可 以 看 做 是 更 好 的 C 

® 支持 数据 抽象 

s 支持 面向 对 象 程序 设计 

e 支持 泛 型 程序 设计 
C++ 最 初 是 由 Bjame Stroustrup 在 新 泽 西 州 茉莉 山 的 贝尔 电话 实验 室 计算 科学 研究 中 心 设计 并 实 
现 的 。 他 的 办 公 室 与 Dennis Ritchie 、Brian Kernighan 、Ken Thompson 、Doug Mcllroy 以 及 其 他 UNIX 
巨人 们 相 邻 。 

Bjarne Stroustrup 在 家 乡 的 丹麦 奥 胡 斯 大 学 数学 专业 获得 了 计算 机 科学 硕士 学 位 。 然 后 , 他 来 
到 剑桥 大 学 , 在 David Wheeler 指导 下 获得 了 计算 机 科学 博士 学 位 。C++ 的 主要 贡献 包括 : 

。 使 抽象 技术 对 于 主流 项 目 来 说 , 其 应 用 代价 可 以 承受 , 易于 管理 。 

9 将 面向 对 象 和 泛 型 程序 设计 技术 用 于 对 性 能 有 较 高 要 求 的 应 用 领域 的 先驱 。 
在 C++ 出现 之 前 , 这 些 技术 (通常 一 起 混杂 在 “面向 对 象 程序 设计 ”的 标签 之 下 ) 并 不 为 工业 界 所 
熟知 。 与 Fortran 之 前 的 科学 计算 程序 设计 和 C 之 前 的 系统 程序 设计 所 处 的 情况 类 似 ， 人 们 “ 公 
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认 ” 这 些 技 术 对 于 实际 应 用 来 说 代价 太 高 , 对 于 “普通 程序 员 " 来 说 太 难 以 掌握 。 





C++ 的 研究 工作 始 于 1979 年 , 在 1985 年 发 布 了 第 一 个 商用 版 本 。 在 最 初 的 设计 和 实现 之 
后 ,Bjame Stroustrup 与 贝尔 实验 室 和 其 他 地 方 的 朋友 们 进一步 对 其 进行 完善 , 直到 1990 年 C++ 
标准 化 进程 正式 开始 。 从 那 时 起 , C++ 的 定义 由 ANSI( 美 国 国家 标准 化 组 织 ) 人 负责 制订 ， 从 1991 
年 起 改 由 ISO( 国际 标准 化 组 织 ) 负 责 。Bjarne Stroustrup 在 这 一 进程 中 承担 了 主要 工作 , 他 是 负责 
语言 新 特性 的 关键 小 组 的 主席 。 第 一 个 国际 标准 (C++98) 在 1998 年 批准 通过 , 第 二 个 版 本 
(C++0x) 正 在 制订 中 。 

经 过 最 初 十 年 的 成 长 ,C++ 最 重要 的 发 展 就 是 STL 一 一 容器 
和 算法 的 标准 库 。 它 主要 是 Alexander Stepanov 几 十 年 努力 的 成 果 ， 
其 目标 是 生成 更 通用 、 更 有 效 的 软件 , 它 从 数学 之 美 、 数 学 之 实用 
中 受到 了 很 多 启发 。 

Alex Stepanov 是 STL 的 发 明 者 和 泛 型 程序 设计 的 先驱 。 他 毕 
业 于 莫斯科 大 学 , 研究 工作 包括 机 器 人 、 算法 及 其 他 领域 , 他 在 这 
些 工作 中 使 用 过 多 种 语言 (包括 Ada、Scheme 和 C++ )。 从 1979 年 
开始 , 他 在 美国 学 术 和 工业 界 工 作 , 曾 为 通用 电气 实验 室 、AT&T 
贝尔 实验 室 、 惠 普 、Silicon Graphics 和 Adobe 等 公司 工作 。 

C++ 语言 家 族 树 如 下 图 所 示 : 


1978-89 


Simula 67 1979-84 1989 


Bjame Stroustmup 最 初 的 设想 是 “支持 类 的 C” 一 一 综合 C 和 Simula 的 思想 。 但 随 着 其 后 继 者 
C++ 的 实现 , 这 一 设想 就 消失 了 。 

人 们 讨论 程序 设计 语言 时 , 常常 集中 在 优雅 的 设计 和 高 级 特性 上 。 但 是 , 以 这 两 方面 评判 , C 和 
C++ 并 不 是 计算 领域 中 历史 上 最 成 功 的 两 种 语言 。 它 们 的 强大 在 于 灵活 性 、 性 能 和 稳定 性 。 重 要 的 
软件 系统 的 生命 期 会 超过 几 十 年 , 它们 通常 会 耗 尽 硬件 资源 , 并 且 还 常常 遇 到 完全 无 法 预料 的 修改 
需求 。C 和 C++ 已 经 证 明了 它们 能 在 这 种 环境 中 苗 壮 成 长 。 我 们 育 欢 引用 Dennis Ritchie 的 名 言 : 
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“有 些 语言 是 为 了 证 明 一 个 观点 而 设计 ,而 其 他 一 些 语 言 则 是 为 了 解决 问题 。 这 里 的 “其 他 ”主要 是 
就 是 指 C。Bjame Stroustrup 喜欢 说 :“ 其 实 我 知道 如 何 设计 一 种 比 C++ 更 漂亮 的 语言 。C++ 与 C 一 
样 , 其 目标 不 是 抽象 的 美 (尽管 我 们 很 赞成 在 可 能 的 情况 下 追求 美 ) 而 是 实用 。 

我 经 常 后 悔 在 本 书 中 没有 使 用 C++0x 的 特性 。 它 本 可 以 简化 很 多 例子 和 解释。 不 过 , 书 中 已 
经 介绍 了 一 些 C++0x 标准 库 的 特性 : unordered_map (参见 21. 6.4 节 )、array( 参 见 20.9 节 ) 和 regexp 
(参见 23.5 ~23.9 节 )。C++0x 还 有 其 他 一 些 特点 : 更 好 的 模板 检查 、 更 简单 更 通用 的 初始 化 以 及 
某 些 地 方 更 健壮 的 表示 法 。 请 参考 我 在 HOPL-II 上 的 论文 。 
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22. 2, 7 今天 的 程序 设计 语言 
目前 还 在 使 用 的 程序 设计 语言 有 哪些 , 用 于 什么 领域 ? 这 确实 是 一 个 难以 回答 的 问题 。 当 前 
语言 的 家 族 树 一 一 即便 是 以 最 简化 的 形式 呈现 , 也 很 拥挤 、 杂 乱 , 如 下 所 示 : 


CSmalialk > 
= 
CJava04 > 


dr ED je 
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CPascal > Object Pascal 
COBOLO4 
COBOL89 . -一 一 


实际 上 , 我 们 在 互联 网 上 (或 其 他 地 方 ) 找 到 的 大 多 数 统计 数据 都 比 谣言 强 不 了 多 少 , 因为 它们 所 
选取 的 都 是 一 些 与 语言 的 使 用 关联 度 很 差 的 指标 。 例 如 , 不 少 网 站 张贴 的 内 容 包括 程序 语言 的 名 
称 、 编 译 器 发 货 量 、 学 术 论 文 量 和 书籍 销售 量 等 。 但 所 有 这 些 指标 都 更 倾向 于 新 语言 而 不 是 已 成 
熟 的 语言 。 我 们 再 换个 问题 , 什么 人 可 以 称 做 程序 员 呢 ? 每 天 都 使 用 程序 设计 语言 的 人 ? 只 是 在 
学 习 时 写 些小 程序 的 学 生 算 是 程序 员 吗 ? 讲授 程序 设计 的 教授 呢 ? 几乎 每 年 都 只 写 一 个 程序 的 
物理 学 家 呢 ? 如 果 一 个 专业 程序 员 每 周 都 会 使 用 几 种 不 同 的 语言 , 那么 他 应 该 被 统计 多 次 还 是 一 
次 呢 ? 我 们 可 以 看 到 , 对 这 些 问题 的 每 个 答案 都 会 导致 不 同 的 统计 方式 和 结果 。 

但 是 , 我 们 认为 有 必要 给 你 一 个 具体 意见 : 2008 年 全 世界 大 约 有 1000 万 专业 程序 员 。 我 们 
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是 从 IDC( 一 个 数据 收集 公司 ) 的 数据 、 与 出 版 商 和 编译 器 提供 商 进行 的 讨论 以 及 各 种 互联 网 资源 
得 出 这 个 结论 的 。 这 个 数量 可 能 不 准确 , 但 我 们 确定 , 无 论 “ 程 序 员 ” 定 义 如 何 , 只 要 大 致 合理 ， 
实际 值 肯定 在 100 万 到 1 亿 之 间 。 程 序 员 们 使 用 哪 种 语言 呢 ?Ada、C、C++、C#、COBOL、For- 
tran、Java、PERL、PHP 以 及 Visual Basic 可 能 (仅仅 是 可 能 ) 占据 了 超过 90% 的 份额 。 

除了 本 章 提 到 的 语言 之 外 , 我 们 还 可 以 列 出 几 十 甚至 上 百 种 语言 。 但 除了 对 感 兴趣 的 和 重要 的 
语言 公平 些 以 外 , 这 没有 任何 意义 。 如 果 需 要 的 话 , 你 可 以 自行 查找 相关 信息 。 一 个 专业 人 员 通 常 
都 做 几 种 语言 , 并 且 有 能 力 在 必要 时 学 习 新 的 语言 。 世 界 上 并 不 存在 适用 于 所 有 人 和 所 有 应 用 的 
“真正 的 语言 。 实 际 上 , 我 们 所 能 想到 的 所 有 重要 系统 , 都 使 用 了 不 止 一 种 语言 来 实现 。 
22. 2.8 参考 资源 

上 面 提 到 的 每 种 语言 者 有 一 个 参考 资料 列表 。 下 面 是 一 些 涵盖 几 种 语言 的 参考 资料 : 

更 多 的 语言 设计 者 的 网 页 /图 片 

www. angelfire. com/ tx4/ cus/ people/. 

几 个 语言 例子 

http ;//dmoz. org/ Computers/ Programming/ Languages/ 

教科 书 

Scott，Michael L. Programming Language Pragmatics. Morgan Kaufmann, 2000. ISBN 1558604421. 

Sebesta, Robert W. Concepts of PBrogrammine Lanpuapes. Addison-Wesley, 2003. ISBN 0321193628. 


历史 书籍 

Bergin, T. J., and R. G. Gibson eds. History of Programming Lanpguages - Il. AddisonWesley, 1996. ISBN 0201895021. 

Hailpern, Brent, and Barbara G. Ryder, eds. Proceedings of the Third ACM SIGPLAN Conference on the 
History of Programming Languages (HOPL-IID). San Diego, CA, 2007. http://portal.acm. org/toc.cfm?id= 
1238844. 

Lohr, Steve. Go To: The Story of the Math Majors, Bridge Players, Engineers, Chess Wizards, Maverick Scientists and 

Jconoclasts -The Propgrammers Who Created the Soflware Revolution. Basic Books, 2002. ISBN 9780465042265. 

Sammet, Jean. PBrogramming Languages: History and Fundamentals, Prentice-FHall, 1969. ISBN 0137299885. 


Wexelblat, Richard L., ed. History of Popgramming Languages. Academic Press, 1981. ISBN 0127450408. 


过》 思考 题 


. 历史 有 什么 用 处 ? 

.程序 设计 语言 有 什么 用 处 ? 请 给 出 几 个 例子 。 

,请 给 出 几 种 可 以 认为 是 客观 优点 的 程序 设计 语言 的 基本 特性 。 
抽象 的 含义 是 什么 ? 更 高 层 的 抽象 呢 ? 

. 我们 对 程序 设计 的 4 个 高 层 的 理念 是 什么 ? 

. 列 出 高 层 程 序 设计 的 潜在 优点 。 

. 什么 是 重用 ? 它 可 以 带 来 什么 好 处 ? 

.什么 是 过 程式 程序 设计 ?给 出 一 个 具体 的 例子 。 

. 什么 是 数据 抽象 ? 给 出 一 个 具体 的 例子 。 

10. 什么 是 面向 对 象 程序 设计 ? 给 出 一 个 具体 的 例子 。 

_11. 什么 是 泛 型 程序 设计 ? 给 出 一 个 具体 的 例子 。 

12. 什么 是 多 范 型 程序 设计 ? 给 出 一 个 具体 的 例子 。 

13. 第 一 个 运行 在 储存 程序 式 计算 机 上 的 程序 出 现在 什么 时 候 ? 
14. David Wheeler 以 什么 工作 知名 ? 

15. John Backus 设计 的 第 一 种 语言 的 主要 贡献 是 什么 ? 

16. Grace Murray Hopper 设计 的 第 一 种 语言 是 什么 ? 
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17. John MeCarthy 的 主要 研究 领域 是 什么 ? 
18，Peter Naur 对 Algol60 有 哪些 贡献 ? 
19. Edsger Dijkstra 以 什么 工作 知名 ? 
20. Niklaus Wirth 设计 并 实现 的 是 哪 种 语言 ? 
21. Anders Hejlsberg 设计 的 是 哪 种 语言 ? 
22. Jean Ichbiah 在 Ada 项 目 中 扮演 什么 角色 ? 
23.Simula 开创 了 什么 程序 设计 风格 ? 
24. Kristen Nygaard 曾 在 哪里 (奥斯陆 之 外 ) 教 书 ? 
25. Ole-Johan Dahl 以 什么 工作 知名 ? 
26. Ken Thompson 是 哪个 操作 系统 的 主要 设计 者 ? 
27，Doug Mecllroy 以 什么 工作 知名 ? 
28. Brian Kemighan 最 著名 的 著作 是 什么 ? 
29.Dennis Ritchie 曾 在 哪里 工作 ? 
30.， Bjame Stroustmp 以 什么 工作 知名 ? 
31. Alex Stepanoy 使 用 哪 种 语言 设计 了 STL? 
32. 列 出 10 种 22.2 节 中 没有 介绍 的 语言 。 
33. Scheme 是 哪 种 语言 的 方言 ? 
34. C++ 最 主要 的 两 个 起 源 是 什么 ? 
35. C++ 语 言 中 的 C 表示 的 是 什么 ? 
36. Fortran 是 一 个 缩写 吗 ? 如 果 是 , 全 称 是 什么 ? 
37. COBOL 是 一 个 缩写 吗 ? 如 果 是 , 全 称 是 什么 ? 
38，Lisp 是 一 个 缩写 吗 ? 如 果 是 , 全 称 是 什么 ? 
39，Pascal 是 一 个 缩写 吗 ? 如 果 是 , 全 称 是 什么 ? 
40.Ada 是 一 个 缩写 吗 ? 如 果 是 , 全 称 是 什么 ? 

， 哪 种 编程 语言 最 好 ? 


A 


在 本 章 中 ,“ 术 语 ” 是 真实 的 语言 、 人 和 和 组织 。 


。 语言 

Ada Aljgol BCPL C C++ COBOL 
Fortran Lisp Pascal Scheme Simula 

。 人 

Charles Babbage John Backus Ole-Johan Dahl Edsger Dijkstra Anders Heijlsberg 
Grace Murray Hopper Jean Ichbiah Brian Kernighan John McCarthy 
Doug Mclroy Peter Naur Kristen Nygaard Dennis Ritchie 
Aljex Stepanov Bjarmne Stroustrup Ken Thompson David Wheeler 
Niklaus Wirth 

e。 组 织 

贝尔 实验 室 ”” Borland 公司 剑桥 大 学 (英国 ) 

ETH( 苏黎世 联邦 理工 学 院 ) ”IBM 公司 麻 省 理工 学 院 

挪威 计算 机 中 心 普林斯顿 大 学 \ 斯 坦 福 大 学 

哥本哈根 理工 大 学 美国 国防 部 美国 海军 


<》 习题 
1. 请 给 出 程序 设计 的 定义 。 
2. 请 给 出 程序 设计 语言 的 定义 。 
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On 小 


vv 


. 浏览 本 书 , 注意 章节 中 的 插图 。 哪 些 插图 是 计算 机 科学 家 ? 编写 一 段 文 字 , 总 结 每 位 科学 家 的 贡献 。 

. 浏览 本 书 , 注意 章节 中 的 插图 。 哪 些 插图 不 是 计算 机 科学 家 ? 指出 每 幅 插图 出 自 哪 个 国家 、 哪 个 领域 。 

. 用 本 章 提 到 的 每 种 语言 各 编写 一 个 “Hello，World” 程 序 。 

. 对 于 本 章 提 到 的 每 种 语言 , 找到 一 本 流行 的 教科 书 , 查找 其 中 使 用 的 第 一 个 完整 程序 。 用 所 有 其 他 语言 
编写 这 个 程序 。 警 告 : 这 个 练习 的 规模 很 容易 达到 100 个 程序 。 

. 我 们 明显 “遗漏 ”了 很 多 重要 的 语言 。 特 别 是 , 我 们 基本 没有 提 及 C++ 之 后 程序 设计 语言 的 发 展 。 列 出 
你 认为 应 该 介绍 的 5 种 现代 语言 , 然后 沿 着 本 章 语言 部 分 的 路 线 , 用 一 页 半 的 篇 幅 介绍 其 中 3 种 。 

. C++ 有 什么 用 处 ? 为 什么 ? 撰写 一 份 10 ~ 20 页 的 报告 。 

. C 有 什么 用 处 ? 为 什么 ? 撰写 一 份 10 ~ 20 页 的 报告 。 

.针对 一 种 语言 (不 包括 C 和 C++ ), 撰写 一 份 10 ~20 页 的 报告 , 描述 这 种 语言 的 起 源 、 目 标 和 功能 。 给 


出 足够 的 具体 例子 。 介 绍 谁 在 使 用 这 种 语言 以 及 用 它 做 什么 ? 


. 谁 是 剑桥 大 学 现任 的 户 卡 斯 教授 ? 

. 本 章 提 到 的 语言 设计 者 中 , 谁 拥有 数学 学 位 ? 谁 没有 ? 

. 本章 提 到 的 语言 设计 者 中 , 谁 拥有 博士 学 位 ? 在 哪个 领域 ? 谁 没有 博士 学 位 ? 

. 本 章 提 到 的 语言 设计 者 中 , 谁 获得 过 图 灵 奖 ? 图 灵 奖 是 什么 ?查找 这 些 人 是 因 何 贡献 而 获奖 。 
.编写 一 个 程序 , 输入 一 个 由 (name，year) 值 对 构成 的 文件 , 例如 (Algol, 1960) 和 (C, 1974) ,并 在 时 间 畏 


上 画 出 这 些 名 字 。 


.修改 上 一 个 练习 的 程序 , 改 为 读 取 由 (name，year，(ancestors ) ) 三 元 组 组 成 的 文件 , 例如 (Fortran ，1956 ， 


()) 、(Algol, 1960，(Fortran) ) 和 (C++，1985，(C，Simula) ) , 在 时 间 轴 中 画 出 这 些 合 言 , 并 在 每 个 祖 
先 和 后 代 之 间 画 一 个 箭头 。 用 这 个 程序 画 出 22. 2. 2 节 和 22. 2.7 节 中 的 图 表 的 改进 版 本 。 


< 附 计 


很 明显 , 我 们 只 是 泛泛 地 介绍 了 程序 设计 语言 的 历史 和 如 何 开发 更 好 的 软件 的 理念 。 我 们 认为 历史 和 


理念 非常 重要 , 以史为鉴 能 使 你 体会 到 什么 是 错误 的 。 我 们 希望 本 章 的 内 容 已 经 传达 出 了 一 些 令 我 们 激动 
的 东西 ,传达 出 了 我 们 的 观点 一 一 好 的 软件 /好 的 程序 设计 方法 这 一 问题 浩瀚 无 边 , 程序 设计 语言 的 设计 和 
实现 已 经 充分 表明 了 这 一 点 。 请 记 住 , 程序 设计 (开发 高 质量 的 软件 ) 才 是 最 基础 、 最 重要 的 ; 程序 设计 语 
言 只 是 工具 。 


第 23 章 文本 人 处理 


“所 谓 显然 的 事情 通常 并 非 真 的 那么 显然 …… 
使 用 “显然 "这 个 词 往往 意味 着 缺乏 逻辑 论证 。” 
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本 章 主要 介绍 如 何 从 文本 中 提取 信息 。 我 们 将 大 量 知 识 以 单词 的 形式 保存 在 文档 中 , 例如 书 
籍 、 电 子 邮件 或 者 “打印 "的 表格 ， 以 便 将 来 能 从 中 提取 出 某 种 更 易于 计算 的 信息 格式 。 在 本 章 
中 , 我 们 首先 回顾 标准 库 中 最 常用 的 文本 处 理 功 能 : string、iostream 以 及 map。 然 后 , 我 们 将 介绍 
正则 表达 式 (regex), 它 可 以 用 来 描述 文本 中 的 模式 。 最 后 , 我 们 将 展示 如 何 使 用 正则 表达 式 从 文 
本 中 寻找 和 提取 特定 的 数据 元 素 , 如 邮政 编码 , 以 及 如 何 验证 文本 文件 的 格式 。 


23. 1 文本 


从 本 质 上 来 说 , 我 们 无 时 无 刻 不 在 处 理 文 本 。 我 们 阅读 的 书籍 中 全 都 是 文本 , 我 们 在 电脑 屏 
幕 上 看 到 的 很 多 内 容 都 是 文本 , 我 们 处 理 的 源 代 码 也 是 文本 。 我 们 使 用 的 (所 有 ) 通 信 信 道 充斥 着 
文本 。 两 个 人 之 间 的 所 有 交流 内 容 也 都 可 以 表示 为 文本 。 但 我 们 不 要 走 极端 , 图 像 和 声音 通常 还 
是 表示 为 二 进 制 格式 ( 即 比 特 包 ) 更 好 些 。 不 过 , 对 于 几乎 所 有 其 他 信息 , 都 适合 使 用 计算 机 程序 
进行 文本 分 析 和 转换 。 

从 第 3 章 开始 , 我 们 就 已 经 看 到 了 iostream 和 string 的 使 用 。 因 此 , 在 本 章 中 , 我 们 只 是 简单 
回顾 一 下 这 些 标准 库 中 的 语言 特性 。 标 准 库 中 的 “映射 "(参见 23.4 节 ) 是 一 种 非常 有 用 的 文本 处 
理工 具 , 我 们 将 以 电子 邮件 分 析 问 题 为 例 展 示 映 射 的 使 用 。 在 回顾 了 这 些 标准 库 特性 后 , 我 们 将 
重点 介绍 如 何 使 用 正则 表达 式 搜 索 文 本 中 的 模式 (参见 23.3 ~23. 10 节 )。 


23. 2 字符 串 


一 个 字符 串 (string) 包 含 一 个 字符 序列 , 并 提供 了 一 些 有 用 的 操作 , 如 向 字符 串 中 添加 一 个 字 
符 、 获 得 字符 串 的 长 度 以 及 字符 串 连接 等 。 实 际 上 , 标准 库 中 的 字符 串 提 供 了 很 多 操作 , 但 其 中 
大 部 分 只 用 于 相当 复杂 的 低层 方式 的 文本 处 理 。 在 本 章 中 , 我 们 只 简单 回顾 少数 最 常用 的 操作 。 
如 果 需 要 的 话 , 你 可 以 在 参考 手册 或 者 专业 级 的 教材 中 查阅 这 些 操作 ( 以 及 全 部 字符 串 操 作 ) 的 细 
节 。 这 些 操作 的 定义 可 以 在 < string > 中 找到 (注意 不 是 < string. h > ) : 
挑选 出 的 一 些 字 符 串 操作 


sl = 电 将 吧 的 内 容 同 予 sl ,s2 可 以 是 字符 串 对 象 或 者 C 风格 字符 串 

8+ 二 X 将 x 添加 到 s 的 末尾 , x 可 以 是 字符 、 字 符 串 或 者 C 风格 字符 串 

s[Li] 数组 下 标 (s 的 第 i 个 字符 ) 

sl + 上 连接 运算 , 结果 字符 捉 的 开始 部 分 措 由 自 sl，, 后 接 92 的 拷贝 

sl ==s2 比较 字符 串 的 值 , sl 或 蛇 可 以 是 C 风格 字符 串 , 但 不 允许 两 者 丝 是 。!1 = 也 类 似 

按 字 典 序 比 较 两 个 字符 串 的 先后 , 两 者 之 一 可 以 是 C 风格 字符 串 ,， 但 不 允许 两 者 丝 是 。 
<=、> 和 >= 也 类 似 


s. Size( ) s 中 字符 的 数目 
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( 续 ) 
挑选 出 的 一 些 字符 串 操作 

s. length( ) ”“”“s 中 字符 的 数目 

s. ¢_str( ) 返回 s 中 字符 构成 的 C 风格 字符 串 

s. begin( ) 指向 第 一 个 字符 的 迭代 器 

s. end( ) 指向 s 末尾 之 后 一 个 位 置 的 迭代 器 

a 将 x 插入 到 s[ pos] 之 前 的 位 置 。x 可 以 是 字符 、 字 符 串 或 者 C 风格 字符 串 。 必 要 时 会 扩展 s 
的 存储 空间 来 容纳 x 

Ee 将 x 插入 到 s[ posj] 之 后 的 位 置 。x 可 以 是 字符 、 字 符 串 或 者 C 风格 字符 串 。 必 要 时 会 扩展 s 
的 存储 空间 来 容纳 x 

s. erase ( pos) 删除 s[ pos] 处 的 字符 。s 的 长 度 减 小 1 


在 s 中 查找 x。x 可 以 是 字符 、 字 符 串 或 者 C 风格 字符 串 。 知 找到 ,, pos 的 值 为 找到 的 字 串 的 


pos =s. find( x) 第 一 个 字符 的 下 标 , 否则 为 npos(s 末尾 之 后 的 位 置 ) 


in >>s 从 流 in 中 读 取 一 个 词 存 人 s 中 , 词 之 间 以 空白 符 间隔 
‘getline( in, s) 从 流 in 中 读 取 一 行 存 人 s 
out <<s 将 s 的 内 容 输 出 到 out 


我 们 已 经 在 第 10 章 和 第 11 章 中 介绍 了 0 操作 , 在 23. 3 节 中 将 进行 小 结 。 注 意 输入 操作 在 
必要 时 会 扩展 字符 串 的 存储 空间 ,因此 可 能 发 生 滋 出 。 

insert( ) 和 append( ) 操作 会 移动 已 有 字符 , 为 新 字符 留 出 空间 。erase( ) 操 作 则 “向 前 ”移动 字 
符 , 避免 删除 字符 后 在 字符 串 中 留 下 空洞 。 

标准 库 字 符 串 实际 上 是 一 个 称 为 basic_string 的 模板 ， 它 支持 多 种 字符 集 , 如 Unicode( 在 “ 普 
通 字符 "之 外 还 提供 了 几 千 个 特殊 字符 ,如 2 、Q 、om 、8、 四 以 及 4 。 例 如 , 如 果 你 需要 声明 一 个 
保存 Unicode 字符 的 类 型 ， 其 名 字 就 叫做 Unicode, 可 以 使 用 如 下 代码 : 

basic_string<Unicode> a_unicode_string; 

我 们 之 前 所 使 用 的 标准 字符 串 类 string, 实际 上 就 是 保存 普通 字符 的 basic_string: 

typedef basic_string<char> string;  //string means basic_string<char> 

本 章 不 会 介绍 Unicode 字符 或 Unicode 字符 捉 , 如 果 你 需要 使 用 这 些 功能 的 话 , 可 以 查阅 相关 
资料 ,你 会 发 现 其 使 用 方法 (从 语言 的 角度 , 以 及 从 string、iostream 和 正则 表达 式 的 角度 ) 与 普通 
字符 和 普通 字符 串 是 一 致 的 。 如 果 你 需要 使 用 Unicode 字符 , 最 好 求助 于 有 经 验 的 人 。 编 写 这 类 
程序 , 除了 程序 设计 语言 方面 的 考虑 外 , 还 要 遵循 系统 方面 的 惯例 。 

在 文本 处 理 语 境 中 , 将 几乎 所 有 内 容 都 表示 为 字符 串 是 很 重要 的 。 例 如 , 在 本 页 中 ,12. 333 
表示 为 6 个 字符 的 字符 串 ( 前 后 都 有 空白 符 ) 。 如 果 我 们 要 读 取 这 个 数 ,， 就 必须 将 这 6 个 字符 转换 
为 一 个 浮 点 型 数 , 然后 才能 进行 算术 运算 。 这 就 要 求 提供 两 个 方向 的 转换 功能 : 值 转换 为 字符 串 
和 字符 串 转 换 为 值 。 在 11.4 节 中 , 我 们 已 经 看 到 了 如 何 利用 stringstream 将 一 个 整数 转换 为 一 个 
字符 串 。 这 种 技术 可 以 推广 到 任何 具有 << 操作 符 的 类 型 : 


template<class T> string to_string(const T& t) 
{ 

ostringstream os; 

Os << ft; 

return 0s.str(); 


} 
其 使 用 方式 如 下 例 : 
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string $1 = to_string(12.333); 
string s2 = to_string(1+5*6—99/7); 


这 两 行 代码 执行 后 , sl 的 值 变 为 “12. 333”, s2 的 值 变 为 “17”。 实 际 上 , to_string( ) 不 仅 可 以 
用 于 数值 类 型 , 还 可 用 于 其 他 任何 具有 << 操作 符 的 类 型 T。 与 之 相反 的 转换 ,也 就 是 从 string 到 
数值 的 转换 , 也 同样 简单 、 有 用 : 


struct bad_from_string : std::bad_cast 
/class for reporting string cast errors 


{ 
const char* what() const  //override bad_casts what() 
{ 
return "bad cast from string”; - 
} 


}; 


template<class T>T from_string(const string& s) 


{ 
istringstream is(s); 
Tt; ; | : 
if (is >> {)) throw bad_from_string(); 
return t; 
} 
使 用 示例 如 下 : 


double d = from_string<double>("12.333 ); 


void do_something(const string& s) 
try 
{ 
int i= from_string<int>(s); 
Ws . 


a (bad_from_string e) { 
error ("bad input string™,s); 

} | 
与 to_string( ) 相 比 , from_string( ) 要 稍微 复杂 一 些 : 同一 个 字符 串 所 表示 的 值 , 可 以 解释 为 很 多 类 
型 。 这 也 意味 着 , 我 们 所 看 到 的 字符 串 内 容 , 未 必 表 示 我 们 所 期 待 的 类 型 的 值 。 例 如 : 

int d = from_string<int>("Mary had a little lamb"); / oops! 
这 样 就 可 能 引起 错误 , 我 们 用 异常 bad_from_string 来 表示 这 类 错误 。 在 23.9 节 中 , 我 们 将 
说 明 为 什么 from_string( ) (或 等 价 的 函数 ) 对 文本 处 理 那 么 重要 , 其 原因 就 在 于 我 们 需要 从 
文本 域 中 提取 数值 。 在 16.4. 3 节 中 , 我 们 已 经 看 到 一 个 类 似 的 函数 get_int( ) 在 GUI 代码 中 
的 应 用 。 

注意 , to_string( ) 和 from_string 这 两 个 函数 是 非常 相似 的 。 实 际 上 , 他 们 大 致 互 为 逆 操 作 。 这 
样 , 对 于 所 有 “适当 的 类 型 T”, 我 们 有 如 下 结论 (忽略 空 日 符 、 舍 入 等 细节 ): 

s==to_string(from_string<T>(s)) /foralls 

以 及 

t==from_string<T>(to_string(t)) /for allt 
“适当 ”的 意思 是 指 T 应 该 具有 默认 构造 函数 、>> 操作 符 以 及 一 个 匹配 的 << 操作 符 。 

注意 ,to_string( ) 和 from_string( ) 的 实现 中 都 使 用 了 一 个 stringstream 来 完成 所 有 困难 的 工作 。 
实际 上 , 对 于 任何 具有 匹配 的 << 和 >> 操作 符 的 类 型 , 我 们 都 可 以 利用 这 种 技术 手段 来 实现 类 型 
之 间 的 转换 操作 : 
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struct bad_lexicaj cast : std::bad_cast 
{ 


const char* what() const { return "bad cast"; } 


}; 


template<typename Target, typename Source> 
Target lexical_cast(Source arg) 


std::stringstream interpreter; 
Target result; 


if (i(interpreter << arg) // read arg into stream 
|| 1(interpreter >> result) / read result from stream 
| !(interpreter >> std: :ws).eof())  / stuff left in stream? 
throw bad_lexical_cast(); 


return result; 
} 
1( interpreter >> std :: ws). eof( ) 看 起 来 有 些 怪 , 但 实际 上 是 很 巧妙 的 , 它 将 提取 数据 后 可 能 遗留 在 
stringstream 中 的 空 日 符 读 取出 来 。 空 白 符 是 允许 出 现 的 , 但 在 它 之 后 不 允许 再 有 任何 字符 , 我 们 
可 以 通过 查看 是 否 到 达 ” 文件 尾 "来 检测 这 一 情况 。 这 样 ， 当 我 们 试图 用 lexical _cast 从 一 个 string 
对 象 中 读 取 一 个 int 值 时 ,“123” 和 “123 “都 会 成 功 读 取 数值 , 而 “123 5 "会 失败 ， 因 为 空格 之 
后 还 有 一 个 字符 5。 


23.3 LO 流 


如 上 节 所 示 , 我 们 利用 0 流 在 字符 串 和 其 他 类 型 间 建 立 起 联系 。LIO 流 库 不 仅仅 可 以 实现 
输入 和 输出 ， 它 还 可 以 实现 字符 串 格式 和 内 存 类 型 之 间 的 转换 。 标 准 库 WO 流 提供 了 对 字符 串 进 
行 读 、 写 和 格式 化 的 功能 。 我 们 已 经 在 第 10 章 和 第 11 章 介 绍 了 iostream 库 , 因此 现在 只 是 简单 
总 结 一 下 : 


LO 流 

in >> x 根据 x 的 类 型 从 in 读 取 数 据 存 人 x 
out << x 根据 x 的 类 型 将 其 内 容 写 人 out 

in. get(c) 从 in 读 取 一 个 字符 存 人 < 

getline( in, s) 从 in 读 取 一 行内 容 存 人 字符 申 s 


标准 流 的 类 层次 如 下 图 所 示 ( 参 见 14.3 节 ) : 





ED re ee et 


这 些 类 一 起 构成 了 标准 流 库 , 使 我 们 可 以 对 文件 和 字符 串 进行 WO 操作 (还 可 对 其 他 任何 可 以 看 
做 文件 或 字符 串 的 对 象 进行 VO 操作 ,如 键盘 、 屏 幕 等 , 参见 第 10 章 ) 。 而 且 , 如 第 10 章 和 第 11 
章 所 述 ， iostream 还 提供 了 精心 设计 的 格式 化 机 制 。 上 图 中 , 箭头 表示 继承 关系 (人 参见 14.3 节 )， 
因而 , 一 个 stringstream 对 象 可 以 作为 一 个 iostream 或 者 istream 或 ostream 来 使 用 。 
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与 字符 串 类 似 ，iostream 可 以 使 用 Unicode 这 样 的 大 字符 集 , 用 法 与 普通 字符 集 一 致 。 我 们 再 
次 提醒 , 如 果 你 需要 使 用 Unicode IO, 最 好 求助 于 有 经 验 的 人 。 为 了 正确 使 用 Unicode, 你 的 程序 
除了 要 考虑 程序 设计 语言 方面 的 问题 外 , 还 要 遵循 系统 方面 的 惯例 。 


23.4 ”映射 


关联 数组 (associative array) 一 一 包括 映射 、 散 列表 ( hash table ) 等 数据 结构 ,是 很 多 文本 处 理 
的 关键 ( key 为 双关 语 , 有 “关键 "之 意 , 在 关联 数组 类 型 中 , 它 又 表示 与 数据 关联 的 “关键 字 ” ) 。 
原因 很 简单 : 当 我 们 处 理 文本 时 ， 主 要 工作 就 是 收集 信息 ,而 信息 通常 与 文本 字符 串 ( 如 名 字 、 地 
址 、 邮 政 编码 、 社 会 保险 号 、 职 位 等 ) 相 关联。 即使 某 些 文本 字符 串 可 以 转换 为 数值 , 但 通常 更 方 
便 也 更 简单 的 方式 还 是 将 它们 按 文本 来 处 理 , 并 使 用 此 文本 作为 信息 的 标识 。21. 6 节 中 的 单词 计 
数 的 例子 是 一 个 很 好 的 简单 示例 。 如 果 你 还 不 太 习惯 使 用 映射 ,请 重新 阅读 21. 6 节 , 然后 再 继续 
学 习 本 节 的 内 容 。 

下 面 我 们 以 电子 邮件 问题 为 例 , 来 讨论 映射 在 文本 处 理 中 的 应 用 。 我 们 常常 需要 搜索 和 分 析 
电子 邮件 消息 和 邮件 日 志 , 这 一 般 要 借助 一 些 专门 程序 (如 Thunderbird 或 Outlook ) 来 完成 。 利 用 
这 些 程序 , 我 们 不 必 查看 海量 的 完整 邮件 内 容 ， 就 能 找到 所 需要 的 信息 。 然 而 , 通常 我 们 要 查找 
的 信息 , 如 发 件 人 、 收 件 人 、 发 送 地 址 以 及 其 他 更 多 的 内 容 , 都 是 以 邮件 头 中 文本 的 形式 呈现 给 
邮件 程序 的 。 这 几乎 就 已 经 是 完整 的 邮件 数据 了 , 所 以 邮件 程序 必须 能 够 从 这 些 海量 数据 中 搜索 
到 我 们 要 找 的 内 容 。 目 前 , 分 析 邮 件 头 的 工具 有 上 千 种 , 大 多 数 都 利用 正则 表达 式 (将 在 23.5 ~ 
23. 9 节 中 进行 详细 介绍 ) 进行 信息 提取 , 并 生成 与 相关 邮件 相 联系 的 某 种 形式 的 关联 数组 。 例 
如 , 我们 常常 需要 查找 某 个 人 发 送 来 的 所 有 邮件 , 或 者 同一 主题 的 所 有 邮件 , 或 者 内 容 与 特定 主 
题 相关 的 所 有 邮件 。 

在 这 里 , 我 们 使 用 一 个 非常 简单 的 邮件 文件 来 展示 一 些 从 文本 文件 中 提取 数据 的 技术 。 这 个 
邮件 文件 的 头 是 来 自 于 www. faqs. org/ rfcs/rfc2822. html 的 实际 的 RFC2822 头 ， 如 下 所 示 


XXX 
XXAX 





From: John Doe <jdoe@machine.example> 
To: Mary Smith <mary@exampie.net> 
Subject: Saying Hello 

Date: Fri, 21 Nov 1997 09:55:06 -0600 
Message-lD: <1234@local.machine.example> 


This is a message just to say hello. 

So, "Hello". 

From: Joe Q. Public <john.q.public@example.com> 

To: Mary Smith <@machine.tid:mary@example.net>, , jdoe@test .example 
Date: Tue, 1 Jul 2003 10:52:37 +0200 

NMMessage-1D: <5678.21-Nov-1997@exampie.com> 


Hi everyone. 


To: nMary Smith: Personal Account" <smith@home.example> 
From: john Doe <jdoe@machine.example> 

Subject: Re: Saying Hello 

Date: Fri, 21 Nov 1997 11:00:00 -0600 

NMessage-1D: <abcd.1234@iocal.machine.tld> 

In- Reply-To: <3456@example.net> 


504 和 甸 四 部 分 大乱 视野 


References: <1234@local.machine.example> <3456@example.net> 


This is a reply to your reply. 


简单 起 见 , 我 们 已 经 丢弃 了 邮件 文件 中 的 大 部 分 内 容 。 我 们 还 在 每 个 邮件 之 后 添加 了 一 行 
“ ---- ”(4 个 连 字 符 ) , 来 标识 邮件 的 结束 , 这 进一步 简化 了 邮件 的 分 析 。 我 们 将 会 写 一 个 简短 
的 “玩具 程序 ”, 它 查找 所 有 “John Doe” 发送 的 邮件 ,并 输出 这 些 邮 件 的 主题 。 这 个 程序 虽然 简 
短 , 但 其 中 的 技术 可 以 用 来 完成 很 多 更 复杂 、 更 有 趣 的 任务 。 

首先 , 我 们 要 确定 是 要 随机 访问 数据 , 还 是 通过 一 个 输入 流 以 流 的 方式 分 析 数 据 。 我 们 选择 
第 一 种 方式 , 因为 在 一 个 实际 程序 中 , 我 们 可 能 只 关心 某 几 个 发 件 人 , 或 者 来 自 于 一 个 发 件 人 的 
某 些 信息 。 而 且 , 相对 于 流 式 访问 , 随机 访问 确实 更 困难 些 , 因此 我 们 可 以 学 习 更 多 技术 。 特 别 
地 , 我 们 将 再 次 使 用 迭代 器 。 | 

我 们 的 基本 思路 是 读 取 一 个 完整 的 邮件 文件 , 将 其 内 容 保 存 到 一 个 称 为 Mail_file 的 数据 结构 
中 。 这 个 数据 结构 用 一 个 向 量 vector < string > 保存 邮件 文件 的 所 有 文本 行 , 并 通过 另 一 个 向 量 
vector < Message > 指明 每 个 邮件 的 起 止 位 置 , 如 下 所 示 : 





Ee ep HE PO SE HH He SE TE Re EE 


为 了 实现 这 一 目的 , 我 们 将 加 入 迭代 器 和 begin( ) 、end( ) 函数 ， 以 便 能 有 一 种 一 致 的 方法 遇 
历 所 有 行 和 所 有 邮件 。 通 过 这 个 “样板 代码 ”, 我 们 可 以 方便 地 访问 邮件 。 完 成 它 之 后 , 我 们 就 可 
以 编写 我 们 的 “玩具 程序 ”了 ， 这 个 程序 将 每 个 发 件 人 的 所 有 邮件 收集 在 一 起 ， 以 方便 访问 , 如 下 
所 示 : | 
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最 终 , 我 们 输出 所 有 发 自 "John Doe" 的 邮件 的 主题 内 容 ， 以 此 来 展示 如 何 使 用 这 套 工 具 程 序 来 处 
理 邮 件 。 


编写 这 个 程序 , 需要 使 用 很 多 基础 的 标准 库 功 能 , 如 下 所 示 : 
#include<string> 

#include<vector> 

帮 nclude<map> 

#include<fstream> 

#include<iostream> 

using namespace std; 


我 们 将 Message 定义 为 vector < string > (保存 文本 行 的 向 量 ) 的 一 对 迭代 器 如 下 所 示 : 
typedef vector<string>: :const_iterator Line_iter; 
class Message { //a Message points to the first and the last lines of a message 
Line_iter first; 
Line_iter last; 
public: 
Message(Line_iter p1, Line_iter p2) :first(p1), last(p2) { } 
Line_iter begin() const { return first; } 
Line_iter end() const { return last; } 
I... 
}; 


我 们 定义 一 个 Mail_file 类 , 保存 文本 行 和 邮件 ,如 下 所 示 : 


typedef vector<Message>::const_iterator Mess_iter; 


struct Mail_ file { //aMail_file holds all the lines from a file 
I/ and simplifies access to messages 
string name; /file name 
vector<string> lines; /the lines in order 
Vector<Message> m;  //Messages in order 


Mail_file(const string& n); // read file n into lines 


Mess_iter begin() const { return m.begin(); } 
Mess_iter end( const { return m.end(); } 
}; 
注意 ,我 们 是 如 何 将 迭代 器 加 入 数据 结构 中 , 以便 能 更 容易 地 、 更 有 条 理 地 访问 数据 结构 的 内 容 。 我 
们 这 里 并 没有 真正 使 用 标准 库 算 法 , 但 由 于 使 用 了 迭代 器 , 程序 很 容易 改 为 使 用 标准 库 算 法 的 版 本 。 
为 了 在 邮件 中 查找 和 提取 信息 , 我 们 需要 下 面 两 个 辅助 函数 ， 


I/ find the name of the sender in a Message; 

I return true if found 

/if found, place the senders name in s: 

bool find_from_addr(const Messages* m, string& s); 


// return the subject of the Message, if any, otherwise ™": 
string find_subject(const Message* m); 


最 后 , 我 们 就 可 以 编写 从 文件 提取 信息 的 代码 了 ,如 下 所 示 : 
int main() 
{ 
Mail_file mfile("my~—mail-file,txt"); ~ / initialize mfile from a file 
I first gather messages from each sender together in a multimap: 


multimap<string, const Message*> sender; 


506 第 四 部 分 姑 逢 视野 


for (Mess_iter p = mfile.begin(); pl!=mfile.end(); ++p) { 
const Message& m = *p; 
string s; 
if (find_from_addr(&m,s)) 
sender.insert(make_pair(s,&m)); 


} 


/ now iterate through the multimap 
/ and extract the subjects of john Doe’s messages: 
typedef multimap<string, const Message*>::const iterator MCl; 
pair<MCI,MCI> pp = sender.equal_range("John Doe"); 
for(MCI p = pp.first; p!=pp.second; ++p) 
cout << find_subject(p->second) << \n'; 


} 
我 们 来 仔细 分 析 一 下 程序 中 是 如 何 使 用 映射 的 。 我 们 使 用 了 一 个 multimap (参见 20. 10 节 和 附录 
B. 4) ， 因 为 我 们 希望 将 来 自 于 同一 个 地 址 的 很 多 邮件 收集 到 一 个 地 方 存储 。 标 准 库 的 multimap 
就 可 以 完成 这 一 任务 (使 得 访问 具有 相同 关键 字 的 数据 更 为 容易 ) 。 显 然 , 我 们 的 工作 分 为 两 部 分 
(一 般 情 况 下 并 不 是 这 样 ) : 


。 创建 映射 。 
。 使 用 映射 。 
我 们 过 历 所 有 邮件 , 用 insert( ) 将 它们 插入 到 multimap 中 ,从 而 创建 了 multimap 的 内 容 , 如 下 


所 不: 
for (Mess_iter p = mfile.begin(); pi=mfile.end(); ++p) { 
const Message& m = *p; 
string s; 
if (find_from_addr(&m,s)) 
sender.insert(make_pair(s,&m)); 
} 


插入 到 映射 中 的 内 容 都 是 我 们 用 make_pair( ) 构造 的 (关键 字 , 值 ) 对 。 我 们 使 用 “自制 的 ”find_ 
from_addr( ) 清 数 查找 发 件 人 的 名 字 ,， 这 里 使 用 空 字符 串 表 示 查 找 失败 。 

我 们 在 程序 中 使 用 了 引用 类 型 的 变量 m, 令 其 引用 p 所 指向 的 对 象 ， 又 将 其 地 址 传递 给 函数 
find_from_addr( ) , 为 什么 不 直接 将 p 传递 给 find_from_addr(p,s) 呢 ? 这 是 因为 , 虽然 我 们 知道 
Mess_iter 指向 一 个 Message 对 象 , 但 具体 实现 中 它 不 一 定 是 一 个 指针 , 所 以 间接 利用 m 保证 传递 
给 find_from_addr( ) 的 是 一 个 指针 。 

在 程序 中 , 我 们 首先 将 所 有 Message 对 象 存 于 一 个 vector 中 , 然后 又 通过 这 个 vector 创建 了 一 
个 multimap, 为 什么 不 直接 将 Message 对 象 存 人 multimap 中 呢 ? 原因 很 简单 , 这 也 是 一 个 数据 处 
理 的 基本 原则 : 

。 首先 , 我 们 创建 一 个 通用 的 数据 结构 , 可 利用 它 来 完成 很 多 工作 。 

e 然后 , 我 们 将 它 转 换 为 用 于 特定 目的 的 专用 结构 。 

通过 这 种 方法 , 我 们 可 以 创建 一 个 可 重用 组 件 的 集合 。 反 之 , 如 果 我 们 直接 创建 一 个 multi- 
map 的 话 , 在 希望 完成 其 他 任务 时 , 可 能 就 需要 对 其 进行 重新 定义 。 特 别 是 , 我 们 的 multimap 对 
象 ( 称 为 senders) 是 按照 邮件 的 地 址 域 进 行 排序 的 。 而 对 于 其 他 很 多 应 用 来 说 , 这 种 顺序 可 能 毫 
无 意义 , 它们 可 能 关心 返回 地 址 、 收 件 人 、 抄 送 地 址 、 主题 、 时 间 故 等 。 

这 种 逐步 (或 者 说 逐 层 ) 创建 应 用 程序 的 方法 , 可 以 极 大 地 简化 设计 、 实 现 、 文 档 和 维护 工 
作 。 关 键 点 在 于 每 个 部 分 都 只 做 一 件 事 , 而 且 是 以 一 种 简单 直接 的 方法 去 做 。 与 之 相对 的 方法 ， 
是 将 所 有 事情 都 放 在 一 起 做 , 这 种 方法 需要 极 高 的 聪明 才智 。 显 然 , 我 们 这 个 “从 一 个 电子 邮件 
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头 中 提取 信息 ”的 小 程序 ,只 是 逐 层 构造 方法 的 一 个 很 简单 的 应 用 。 逐 层 构造 方法 的 保持 独立 组 
件 相 分 离 、 模 块 化 以 及 渐进 构造 的 思想 , 会 随 着 问题 规模 的 增 大 体现 出 更 大 的 价值 。 

为 了 提取 所 需 信 息 我 们 简单 地 使 用 equal_range( ) 函数 查找 所 有 包含 关键 字 “John Doe” 的 条 目 。 
然后 遍历 它 返回 的 序列 [first, second) 中 的 所 有 元 素 , 利用 find_subject( ) 提 取 主 题 域 ,如 下 所 示 : 


typedef multimap<string, const Message*>::const iterator MCI1; 
pair<MC]I,MCL> pp = sender.equal_range("John Doe"); 


for (MCI p = pp.first; pi!=pp.second; ++p) 
cout << find_subject(p—>second) << \n’; 


当 我 们 遍历 一 个 映射 的 元 素 时 , 我 们 得 到 一 个 (关键 字 , 值 ) 对 的 序列 。 对 于 每 个 对 , 第 一 个 元 素 


(本 例 中 是 string 类 型 的 关键 字 ) 称 为 first, 第 二 个 元 素 称 (本 例 中 是 Message 类 型 的 值 ) 为 second 
(参见 21.6 节 )。 


23. 4. 1 实现 细节 z 

显然 , 我 们 需要 实现 前 面 程序 中 所 使 用 的 函数 。 我 们 可 以 将 这 个 工作 作为 练习 ,以 节省 版 
面 。 但 我 们 决定 给 出 这 些 实现 细节 ,以 使 这 个 例子 更 加 完整 。Mail_file 的 构造 函数 打开 邮件 文 
件 , 并 构造 lines 和 m 两 个 向 量 ,如 下 所 示 : 


Mail_file:: Mail_file(const string& n) 
/ open file named "m" 
// read the lines from "n” into "lines" 
/find the messages in the lines and compose them inm 
// for simplicity assume every message is ended by a "————'" line 


ifstream in(n.c_str()); /open the file 
if (Yin) { 
Cerr << "nO "<<n<< \n'; 
exit(1); / terminate the program 


} 


string s; oo 
while (getline(in,s)) tines.push_back(s); // build the vector of lines 


Line_iter first = lines.begin(); . // build the vector of Messages 
for (Line_iter p = lines.begin(); pl=lines.end(); ++p) { 
if (*p == "———-—") 1{ // end of message 
m.push_back(Message(first,p)); 
first=p+1; //-——— not part of message 


} 
} 
这 有 段 程序 中 的 错误 处 理 代码 是 不 完整 的 。 如 果 我 们 希望 这 个 程序 真正 能 够 使 用 , 还 需要 进一步 
试 一 试 什么 样 的 错误 处 理 代码 才 算 是 “更 好 的 ”? 修改 Mail_file 的 构造 函数 ， 处 理 

与 ”---- “相关 的 可 能 的 格式 错误 。 

下 面 是 find_from_addr( ) 和 find_subject( ) 的 实现 ， 当 前 的 版 本 只 是 简单 地 占据 位 置 而 已 , 并 
不 是 完整 的 实现 , 当 我 们 能 更 好 地 从 文件 中 识别 信息 (使 用 正则 表达 式 ,参见 23. 6 ~ 23. 10 节 ) 时 ， 
将 给 出 更 好 的 实现 方式 ,如 下 所 示 

int is_prefix(const string& s, const string& p) 


/is p the first part of s? 
{ 


508 第 四 部 分 茹 乱 现 野 


int n.= p.size()» 
if (string(s,0,n)==p) return n; 
return 0; 


} 


bool find_from_addr(const NMessage* m, String& s) 
{《 
for(Line_iter p = m->begin(); p!=m->end(); ++p) 
if (int n = is_prefix(*p,"From: ")) 1 
s= string(*p,n); 
return true; 


_ return false; 


} 
string find_subject(const Message& m) 
{ 
for(Line_iter p = m.begin(0); p!=m.end(); ++p) 
if (int n = is_prefix(*p,"Subject: ")) return string(*p,n); 
return ""» . 
} 


注意 ,我 们 使 用 子 串 的 方式 ; string(s, n) 构 造 了 一 个 包含 s[n] ~s[s. size( ) -1] 之 间 字符 的 
子 串 ,而 string(s, 0, n) 则 构造 了 一 个 包含 s10]~sLn -1 之 间 字 符 的 子 串 。 由 于 这 些 操 作 会 创 
建新 的 字符 串 并 进行 字符 复制 , 因此 在 使 用 上 必须 注意 性 能 问题 。 
为 什么 find_from_addr( ) 和 find_subject( ) 如 此 不 同 ? 比如 ，, 一 个 返回 bool 值 ， 而 另 一 个 返回 
string。 原 因 在 于 我 们 想 说 明 以 下 两 方面 内 容 : 
e find_from_addr( ) 应 该 区 分 有 地 址 行 但 内 容 为 空 (""”) 和 无 地 址 行 两 种 不 同 的 情况 。 对 于 第 
一 种 情况 , find_from_addr( ) 返 回 true( 因 为 找到 了 地 址 行 ) 并 将 s 设置 为 空 字符 串 "" (因为 
地 址 为 空 ) 。 而 对 于 第 二 种 情况 , 应 该 返回 false( 因为 没有 地 址 行 ) 。 
。 对 于 主题 为 空 , 或 者 没有 主题 行 的 情况 , find_subject( ) 都 返回 ""。 
find_from_addr( ) 将 两 种 情况 区 分 开 来 , 这 是 否 有 意义 呢 ?” 是 否 必要 呢 ? 我 们 认为 是 有 意义 的 , 而 
且 绝 对 是 必要 的 。 当 在 数据 文件 中 查找 信息 时 , 会 频繁 出 现 这 种 不 同情 况 间 的 细微 差别 : 我 们 是 
否 找到 了 想 要 查找 的 域 ? 这 个 域 中 的 内 容 是 否 有 用 ? 在 一 个 实际 的 程序 中 , find_from_addr( ) 和 
find_subject( ) 都 应 该 按照 现在 的 find_from_addr( ) 的 风格 来 设计 , 以 使 用 户 能 区 分 这 种 差别 。 
现在 ,这 个 版 本 的 程序 还 没有 进行 过 性 能 优化 , 但 对 于 大 多 数 应 用 场景 来 说 , 应 该 已 经 足够 
快 了 。 特 别 是 它 对 输入 文件 只 读 取 一 次 , 而 且 对 于 文件 中 的 文本 也 不 会 保存 多 份 拷贝 。 对 于 大 文 
件 , 用 unordered_multimap 替换 multimap 可 能 会 提高 性 能 , 但 这 未 经 过 实验 验证 , 无 法 下 定论 。 
如 果 你 对 标准 库 中 的 关联 容器 ( map、multimap、set、unordered_map 和 unordered_multimap ) 还 
不 太 熟 悉 的 话 , 请 参考 21.6 节 。 


23.5 一 个 问题 


WO 流 和 string 可 以 帮助 我 们 读 写 、 存 储 字符 序列 , 并 对 其 进行 一 些 基 本 操作 。 但 是 , 在 应 用 
中 一 个 非常 常见 的 问题 是 : 对 于 要 处 理 的 文本 , 我 们 需要 考虑 其 中 包含 一 个 字符 串 或 多 个 相似 字 
符 串 的 情况 。 我 们 来 看 一 个 很 简单 的 例子 : 查找 一 个 电子 邮件 (一 个 单词 序列 ) 中 是 否 包 含 美国 某 
些 州 的 邮政 编码 ( 州 名 的 缩写 加 上 邮政 编码 一 一 两 个 字母 后 接 5 个 数字 ), 如 下 所 示 : 


string s; 
while (cin>>s) { 
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if (s.size()== 
&& isalpha(s[0]) && isaipha(s[1]) 
&& isdigit(s[2]) && isdigit(s[3]) && isdigit(s[4]) 
&& isdigit(s[5]) && isdigit(s[6])) 
cout << "found "” <<s << \n'; 
} 


其 中 isalpha(x) 判 断 x 是 否 是 字母 , isdigit(x) 判 断 x 是 否 是 数字 (参见 11.6 节 )。 
这 个 条 单 (过 于 简单 了 ) 的 解决 方案 存在 徊 干 问题 : 
。 它 太 宛 长 了 (4 行 代码 ,8 个 函数 调用 ) 。 
。 我 们 忽略 了 所 有 没有 用 空 Oe 文 分 开 的 邮政 编码 ( 如 "TX77845" 、 TX77845 
-1234 以 及 ATX77845 ) 。 
。 我 们 忽略 了 (有 意 的 ?) 所 有 用 空白 符 分 隔 州 名 缩写 和 数字 的 邮政 编码 ( 如 TX-77845 ) 。 
。 我 们 将 州 名 缩写 为 小 号 的 字符 串 也 识别 为 合法 的 邮政 编码 ( 有意 的 ?)( 如 tx77845 ) 。 
e。 如 果 我 们 希望 查找 完全 不 同 格式 的 邮政 编码 (例如 CB30FD ) , 不 得 不 重 写 全 部 代码 。 
应 该 还 有 更 好 的 解决 方案 ! 但 在 设计 新 的 方法 之 前 , 我 们 来 分 析 一 下 ， 当 处 理 更 复杂 的 情况 
时 ,如 果 还 使 用 “简单 有 效 的 旧 方 法 "来 编写 代码 , 会 遇 到 哪些 问题 : 
。 如 果 希 望 处 理 多 种 格式 ,我们 不 得 不 加 入 计 语 句 和 switch 语句 。 
。 如 果 希 望 既 能 处 理 大 写 又 能 处 理 小 写 , 我 们 不 得 不 进行 显 式 的 大 小 写 转换 (通常 转换 为 小 
写 ) 或 者 再 加 入 并 语句 。 
。 我 们 希望 能 以 某 种 形式 ( 何 种 形式 ?) 来 描述 我 们 要 查找 的 上 下 文 。 这 意味 着 我 们 必须 处 理 
单个 字符 而 不 是 字符 串 , 而 且 失 去 了 iostream 提供 的 很 多 优点 (参见 7. 8.2 节 )。 
如 果 你 愿意 , 可 以 使 用 旧 方 法 实现 上 述 功能 。 但 显然 , 沿 着 这 条 路 走 下 去 , 程序 中 会 充斥 着 大 量 
才 语 句 , 来 处 理 大 量 的 特殊 情况 。 即 便 是 前 面 那个 简单 的 例子 , 我 们 也 和 需要 处 理 一 些 不 同 选项 ( 例 
如 , 同时 支持 5 位 和 9 位 数字 的 编码 ) 。 对 于 其 他 很 多 实例 , 我 们 都 需要 处 理 上 下 文中 的 重复 ( 例 
如 , 任意 多 个 数字 后 接 一 个 感叹 号 , 如 123!1 和 1234561)。 另 外 , 我 们 还 必须 处 理 前 级 和 后 缀 。 
就 像 11.1 节 和 11. 2 节 中 讨论 的 那样 ， 人 们 对 输出 格式 的 偏好 是 不 会 被 程序 员 对 规律 性 和 简洁 性 
的 追求 所 局 限 的 。 你 只 要 思考 一 下 人 们 书写 日 期 的 五 花 八 门 的 格式 , 就 会 赞同 这 一 观点 : 


2007-06-05 
June 5, 2007 
jun 5, 2007 

5 june 2007 
6/5/2007 
5/6/07 


此 时 , 甚至 更 早 , 一 个 有 经 验 的 程序 员 就 会 下 结论 :“ 一 定 有 更 好 的 解决 方法 1”, 然后 就 去 寻找 新 
的 方法 了 (而 不 会 再 用 旧 方 法 编写 代码 )。 解 决 文本 上 下 文 搜索 问题 的 一 个 最 简单 而 且 最 通行 的 
方法 是 使 用 所 谓 的 正则 表达 式 。 正 则 表达 式 是 大 量 文本 处 理 的 基础 ，UNIX 的 grep 命令 就 是 基于 
正则 表达 式 的 (参见 习题 8), 很 多 文本 处 理 语言 (如 AWK、PERL 以 及 PHP) 也 都 将 支持 正则 表达 
式 作为 必 备 的 功能 。 ， a z 

我 们 借助 一 个 库 来 实现 基于 正则 表达 式 的 搜索 。 这 个 库 会 成 为 下 一 版 C++ 标 准 (C++0x) 的 
一 部 分 , 它 与 PERL 中 的 正则 表达 式 处 理 程序 是 兼容 的 。 这 样 ，PERL 正则 表达 式 处 理 的 大 量 文 
档 、 教 程 和 手册 就 都 可 以 拿 来 作为 参考 。 例 如 ,可 以 参考 C++ 标准 委员 会 的 工作 文档 (在 互联 网 
上 搜索 “WG21” 有 即 可 找到 ), 或 者 是 John Maddok 号 的 boost :: regex 的 文档 , 以 及 大 多 数 PERL 的 教 
程 。 在 本 章 中 , 我 们 会 介绍 正则 表达 式 的 一 些 基本 概念 和 基本 使 用 方法 。 
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试 一 试 前 面 两 个 段落 “粗心 地 ”使 用 了 几 个 你 未 见 过 的 名 词 和 缩写 , 而 未 加 解释 。 
请 在 互联 网 上 搜索 这 些 名 词 ， 了 解 它们 的 含义 。 


23.6 正则 表达 式 的 思想 


正则 表达 式 的 基本 思想 是 : 定义 一 个 模式 , 在 文本 中 搜索 这 个 模式 。 我 们 以 邮政 编码 问题 为 


例 , 看 看 对 于 TX77845 这 样 的 邮政 编码 如 何 定义 模式 。 下 面 是 第 一 个 尝 
wwddddd 


其 中 w 表示 “任意 字母 ”, d 表示 “任意 数字 ”。 这 里 使 用 w( 表示 “ word”) 而 不 是 1( 表示 “letter” )， 
是 因为 1 太 容 易 与 数字 1 混 消 了 。 对 于 本 例 , 这 种 符号 表示 是 没有 问题 的 , 但 我 们 还 是 来 看 一 看 


它 对 于 更 复杂 的 情况 ,如 9 位 数 子 的 邮政 编码 格式 (TX77845-5629 ) 是 否 还 有 效 : 
wwddddd-dddd 


这 个 模式 看 起 来 没有 什么 问题 , 但 d 如 何 就 能 表示 “任意 数字 ”, 而 “-” 就 表示 它 的 字面 意思 一 一 
“ 连 字符 ” 吗 ? 不 管 怎样 , 我 们 确实 应 该 指出 w 和 d 具有 特殊 含义 ; 它们 表示 字符 集 而 非 字符 的 字 
面 含义 (w 表示 “一 个 a 或 b 或 c 或 …… , d 表 示 “ 一 个 1 或 2 或 3 或 ……”) 。 这 有 些 过 于 微妙 了 ， 
更 好 的 表示 方式 是 在 这 种 表示 一 类 单词 的 字母 之 前 加 上 一 个 反 斜 线 符号 , 以 此 来 指出 这 是 一 个 特 
殊 符号 ,而 不 是 字面 含义 , 这 与 C++ 语言 中 区 分 特殊 符号 的 方式 是 相同 的 (例如 ，\n 表示 换行 ) 。 
于 是 模式 变 为 : 
wwad\d\d\d\d—\d\d\d\d 

新 的 模式 看 起 来 有 些 丑 陋 , 但 至 少 不 会 引起 歧义 , 而 且 反 斜 线 符号 显然 具有 一 种 “这 是 不 寻常 内 
容 ” 的 含义 。 在 这 里 , 我 们 表示 一 个 字符 多 次 重复 的 方式 就 是 简单 地 重复 几 次 。 这 样 做 令 人 厌烦 ， 
而 且 容 易 出 错 。 我 们 真 的 在 连 字 符 之 前 获取 了 5 个 数字 , 而 在 其 后 获取 了 4 个 数字 吗 ? 答案 是 肯 
定 的 。 但 我 们 自始至终 没有 明确 地 表达 5 和 4, 而 是 需要 通过 手工 计数 来 保证 数量 正确 。 更 好 的 


方法 是 在 字符 之 后 用 一 个 数值 表示 重复 的 次 数 ， 例如 : 
\w2a\d5—\d4 


我 们 同样 应 该 定义 某 种 语法 , 来 说 明 2、5 和 4 是 计数 值 , 而 不 是 表示 文本 中 应 该 出 现 这 几 个 数 


字 。 我 们 将 计数 值 放 在 花 括 号 中 来 表示 这 种 含义 : 
\w{2}\d{5}-\d{4} 


这 种 语法 使 得 “{” 成 为 与 “\” 一 样 的 特殊 字符 , 但 这 是 不 可 避免 的 。 而 且 ， 当 我 们 需要 表示 文本 
中 出 现 花 括号 和 反 斜 线 符号 的 时 候 , 也 有 办 法 处 理 。 

到 目前 为 止 , 看 起 来 还 不 错 , 但 我 们 还 需要 解决 两 个 更 为 棘手 的 细节 : 最 后 4 个 数字 是 可 选 
的 。 我 们 设计 的 模式 , 应 该 既 能 接受 TX77845, 也 能 接受 TX77854-5629。 解 决 这 一 问题 有 两 种 方 
式 , 一 种 是 : 

\w{2)\d{5} 或 \w{2)\d{5})-\d{4} 

另 一 种 是 : 

\w{23d{5} 和 可 选 的 -\d{4)} 

为 了 能 准确 地 描述 这 两 种 方式 , 我 们 首先 需要 有 一 种 能 表达 分 组 ( 子 模式 ) 的 语法 ,用 来 描述 \w 
121\dl51 和- \dj4} 是 \wf21\df15} - \d14} 的 两 个 组 成 部 分 。 习 惯 上 , 我 们 用 括号 来 表示 分 组 的 


概念 ， 例如: 
Gwf2hd(5DCvd4]) 


我 们 现在 已 经 将 模式 划分 为 两 个 子 模式 了 , 接 下 来 就 可 以 描述 我 们 最 初 的 意图 了 一 一 第 二 部 
分 是 可 选 的。 与 前 面 一 样 , 新 功能 的 引入 伴随 着 新 的 特殊 符号 的 引入 , 描述 子 模式 的 “(” 现 在 与 
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“\ 和 “| "一 样 “特殊 "了 。 而 描述 可 选 的 概念 , 我 们 引入 两 个 新 的 特殊 符 瑟 zs 让 用 豆 才 示 &% 工 ? 
(两 个 子 模式 二 选 一 ) 的 概念 ,“?” 用 来 表示 某 个 子 模式 可 选 ( 有 或 无 ) 的 概念 。 于 是 ,邮政 编码 后 
4 位 数字 可 选 的 第 一 种 表示 方式 为 ; 

(ww{2jvd5HICw{2Nd5] 一 vd4)) 

第 二 种 方式 : 

(Ww{2Nd{5}))(—\d{4))? 
与 花 括 号 表示 计数 一 样 ( 如 \wi2| ) , 我 们 用 问号 (?) 做 后 缀 来 表示 可 选 的 概念 。 例 如 ,(-\d|4} )? 
表示 “-\d14} 是 可 选 的 "。 也 就 是 说 , 可 以 接受 以 一 个 连 字符 接 4 个 数字 为 后 缀 的 邮政 编码 ; 当 
然 , 没有 这 样 后 缀 的 编码 也 是 可 以 接受 的 。 实 际 上 ,5 位 数字 编码 ( \w|21 \d15| ) 两 边 的 括号 没有 
任何 作用 , 可 以 将 其 去 掉 : 

\w{2)\d{5}(—\d{4})? 

为 了 与 23.5 节 中 提出 的 需求 完全 吻合 , 我 们 在 开始 的 两 个 字母 之 后 加 上 一 个 可 选 的 空格 : 

\w{2} TV\d{5}(—\d{4))? 
“ -" 看 起 来 有 点 怪 ， 它 实际 就 是 一 个 空格 后 接 一 个 ?, 表示 空格 是 可 选 的 。 如 果 你 不 想 用 这 么 突 无 
的 形式 , 可 以 把 空格 放 在 括号 中 , 例如 ; 

Ww{2}( )I\d{5}((—\d{4})? 
如 果 还 是 觉得 比较 含糊 , 可 以 引入 一 个 新 的 特殊 符号 来 表示 空格 符 , 如 \s(s 表示 “space” ) 。 于 是 
模式 变 为 : 

\w{2N\sT\Vd{5}(—\d {4})? 
看 起 来 已 经 达到 最 初 的 要 求 了 , 但 是 ， 如 果 有 人 在 开头 的 两 个 字母 之 后 写 了 两 个 空 格 , 会 发 生 什 
么 情况 呢 ? 按 现在 的 定义 , 模式 会 接受 TX77845 和 TX 77845, 但 不 接受 TX 77845, 这 显然 不 符 
合 要 求 。 我 们 需要 一 种 语法 来 描述 “0 或 多 个 空格 符 ”, 我 们 引入 特殊 符号 * * ”以 它 作 为 后 缀 就 
表示 “0 或 多 个 ”的 含义 。 模 式 可 以 写 为 : 

\w{2hs Vd{5}(—\d {4})? 
如 果 你 随 着 本 节 的 讲述 一 步 步 地 走 过 来 , 会 觉得 这 个 最 终 的 正则 表达 式 很 合理 。 这 种 表示 模式 的 
方法 符合 逻辑 而 且 非 常 简洁 。 而 且 , 我 们 并 非 随意 地 选择 了 一 些 描述 方法 , 本 节 所 介绍 的 符号 表 
示 都 是 非常 普遍 和 通用 的 。 对 于 很 多 文本 处 理工 作 , 你 必须 编写 、 阅读 这 种 符号 表示 。 当 然 , 这 
种 描述 方法 看 起 来 有 些 古怪 ,好 像 是 你 家 的 小 猫 在 键盘 上 散步 所 产生 符号 串 。 而 且 , 采用 这 样 的 
描述 方法 , 项 错 任何 一 个 符号 (其 至 是 一 个 空格 ) 都 可 能 完全 改变 其 含义 。 但 是 , 请 尽量 熟悉 它 。 
我 们 无 法 找到 任何 其 他 描述 方法 能 明显 优 于 正则 表达 式 。 而 且 , 这 种 描述 风格 自 30 年 前 由 UNIX 
的 grep 命令 引入 后 , 一 直流 行 到 现在 , 甚至 从 未 进行 过 大 的 修改 。 


23. 7 用 正则 表达 式 进 行 搜索 


现在 , 我 们 可 以 使 用 上 一 节 定 义 的 邮政 编码 的 模式 来 搜索 文件 中 的 邮政 编码 了 。 程 序 先 定义 


模式 , 然后 逐 行 读 取 文件 , 在 其 中 搜索 模式 。 如 果 在 某 行 中 找到 了 模式 , 则 输出 行 号 , 如 下 所 示 


丰 nclude <boost/regex.hpp> 
#include <iostream> 
#include <string> 

#include <fstream> 

using namespace std; 


int main() 
{ 
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ifstream in("file.txt") /input file 
if (tin) cerr << "no filen";. 


boost::regex pat ("\Ww{2}\s*Wd{5}(—Wd{4)3"); WZIP code pattern 
cout << "pattern: "<< pat << \n'; 


int lineno = 0; 
string line; // input buffer 
while (getline(in,line)) { 
++lineno; 
boost: :smatch matches; / matched strings go here 
if (boost: :regex_search(jine, matches, pat)) 
cout << lineno << ": " << matchesI0] << \n'; 
} 
} 


程序 的 一 些 细节 需要 解释 一 下 , 首先 看 看 下 面 的 程序 : 


#include <boostregex.hpp> 让 


boost::regex pat ("\w{2}N\s*Nd{5}(-WNd{4})?"); // ZIP code pattern 
boost: :smatch matches; / matched strings go here 
if (boost: :regex_search(line, matches, pat)) 


我 们 这 里 使 用 的 是 boost 中 的 regex 库 , 它 很 快 就 会 成 为 C++ 标准 库 的 一 部 分 了 。 在 使 用 之 
前 , 你 需要 安装 这 个 库 。 我 们 使 用 显 式 的 限定 符 boost :: regex 指明 所 使 用 的 函数 和 类 型 来 自 于 re- 
gex 库 。 


我 们 再 回 到 正则 表达 式 , 看 这 部 分 代码 : 
boost: :regex pat ("\w{2}N\s*Wd{5}(—WNd{4))3"); 
cout << "pattern: ”<< pat << An ; 


此 处 我 们 先 定义 了 一 个 模式 pat( 类 型 为 regex), 并 将 其 输出 到 屏幕 。 注 意 , 我 们 定义 pat 为 : 
"Nw{2}7N\s "Nd{5}(-MNd{4})3" 
运行 程序 , 输出 的 结果 是 : 
pattern: \w{2N\s\d{5}(—\d{4})? 
我 们 知道 , 在 C++ 字 符 串 中 , 反 斜 线 是 转 义 字符 (参见 附录 A. 2.4) 。 因 此 要 得 到 反 斜 线 符号 本 身 
的 话 , 需要 写 两 个 反 斜 线 “\\”。 
”一 个 regex 模式 实际 上 也 是 一 个 字符 串 , 因此 我 们 可 以 用 “<< ”输出 其 内 容 。 但 一 个 regex 不 
仅仅 是 一 个 字符 串 , 它 还 是 一 种 复杂 的 模式 匹配 机 制 。 当 初始 化 一 个 regex 变量 时 , 这 个 机 制 就 
建立 起 来 了 。 这 种 复杂 机 制 已 经 超出 了 本 书 的 讨论 范围 , 但 我 们 无 需 了 解 这 些 , 我 们 只 要 知道 ， 
一 旦 用 上 节 定 义 的 模式 初始 化 了 一 个 regex 变量 , 我 们 就 可 以 用 它 在 文件 的 每 一 行 中 搜索 邮政 纺 
码 了 : 


boost: :smatch matches; 
if boost: :regex_search(line, matches, pat)) 
cout << lineno << ™: " << matches[I0] << \n'; 


regex_search(line，matches ，pat) 搜索 line 中 与 正则 表达 式 pat 匹配 的 内 容 , 如 果 找 到 , 则 将 结果 保 
存在 matches 中 。 如 果 未 找到 匹配 内 容 , 则 返回 false。 : 

变量 matches 的 类 型 是 smatch, 前 缀 s 表示 “ 子 ( 匹 配 )”(sub) 的 概念 。 一 个 smatch 本 质 上 是 
一 个 子 匹配 的 向 量 。 第 一 个 元 系 ( 本 例 中 为 matchesL0]) 是 完整 匹配 。 如 有 果 i < matches. size( ), 我 
们 可 以 将 matches[i] 当做 一 个 字符 串 。 对 于 一 个 正则 表达 式 ， 如 果 最 多 有 N 个 子 模式 ， 则 mat- 
ches. size( ) ==N+1。 


那 什么 是 子 模式 呢 ? 一 个 较 好 的 初步 的 回答 是 :“ 模 式 中 任何 放 在 括号 中 的 内 容 都 可 以 作为 
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一 个 子 模式 。” 如 模式 “\\wi2i \\s * \\d|51( -\\dj4} )?” 中 , 我 们 唯一 能 看 到 的 子 模式 是 4 位 扩 
展 数字 , 因为 它 是 在 括号 中 的 , 因此 我 们 猜测 (实际 就 是 这 样 )matches. size( ) ==2。 这 样 , 我 们 猜 
测 可 以 通过 matches 很 容易 地 访问 后 4 位 数字 , 如 下 面 代码 所 示 : 


while (getline(in,line)) { 
boost: :smatch matches; 
if (boost: :regex_search(line, matches, pat)) { 


cout << lineno << ": " << matches[0] << \n'; / whole match 
让 (1<matches.size() && matches[1].matched) 


cout <<""\t: "<< matches[1] << \n'; / sub-match 
} 、 
} 


严格 来 说 , 我 们 不 必 测 试 1 < matches. size( ) ， 因 为 我 们 已 经 知道 模式 的 详细 结构 。 但 最 好 还 是 加 
上 这 个 检测 (虽然 这 令 我 们 看 起 来 有 点 像 偏 执 狂 ) ， 因 为 我 们 已 经 试验 过 多 种 不 同 的 模式 ,并非 所 
有 模式 部 恰好 有 一 个 子 模式 。 我 们 可 以 通过 matches 中 的 (对 位 元 素 ) , 来 判断 一 个 子 模式 是 否 匹 
配 成 功 。 在 本 例 中 , 是 通过 matches[ 1 ]. mathced 来 判断 的 : 当 matches[ i]. matched 为 假 时 ， 即 子 
模式 未 匹配 时 ,matches[ i] 的 内 容 会 是 一 个 空 字符 串 。 类 似 地 , 不 存在 的 子 模式 ( 如 对 本 例 的 模式 
访问 matehes[ 17] ) 会 按 未 匹配 来 处 理 。 

对 包含 如 下 内 容 的 文件 测试 我 们 的 程序 

address TX77845 

ffff tx 77843 asasasaa 

BEBE TX3450-23456 

howdy 

ZZZ TX23456 一 3456sss ggg TX33456-1234 

CVZCV TX77845-1234 sdsas 


XXxXTx77845xxx 
TX12345-123456 


得 到 如 下 输出 结果 : 
pattern: "\w{2Ns*\d{5}(—\d{4})?" 
1: TX77845 

2: tx 77843 

5: TX23456-3456 

: -3456 

6: TX77845-1234 

: -1234 

7: Tx77845 

8: TX12345-1234 

: ~1234 


注意 : 

。 我 们 未 被 ggg 那 行 中 错误 的 格式 所 欺骗 。( 它 错 在 娜 里 ?) 

。 在 zzz 那 行 中 , 我 们 只 找到 了 第 一 个 邮政 编码 (本 来 就 是 要 求 每 行 只 找 一 个 ) 。 

。 在 第 5 行 和 第 6 行 中 我 们 正确 地 找到 了 后 缀 形式 的 编码 。 

。 我 们 找到 了 第 7 行 中 "隐藏 "在 xxx 中 的 编码 。 

。 我 们 找到 了 隐藏 在 TX12345-123456 中 的 编码 (TX12345-1234, 这 样 做 是 否 不 正确 ?) 。 


23. 8 正则 表达 大 式 语 法 


上 一 节 介 绍 了 一 个 较为 简单 的 正则 表达 式 匹配 的 例子 。 下 面 我 人 为 系统 、 完整 地 介绍 一 下 
正则 表达 式 ( 以 regex 库 为 线索 来 介绍 )。 
正则 表达 式 ( 简 称 正则 式 ,“regexp” 或 “regex”) 实 际 上 是 一 种 表达 字符 模式 的 语言 ， 只 不 过 这 
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种 语言 的 规模 很 小 。 它 是 一 种 强大 (表达 能 力 强 ) 而 简洁 的 语言 ,而 又 有 些 神 秘 。 经 过 几 十 年 的 使 
用 , 产生 了 很 多 微妙 的 特性 和 “方言 "。 在 本 章 中 , 我 们 只 介绍 它 的 一 个 子 集 , 这 也 是 使 用 最 为 广 
泛 的 一 种 方言 (PERL) 。 如 果 你 希望 了 解 更 多 的 特性 以 便 表 达 更 复杂 的 模式 , 或 者 你 希望 了 解 其 
他 方言 , 请 搜索 互联 网 。 网 络 上 相关 的 学 习 指 南 (质量 差异 很 大 ) 俯 拾 即 是 。 特 别 是 ，boost :: regex 
规范 及 其 标准 委员 会 文档 (WG21 TR1 ) 很 容易 找到 。 

boost regex 库 还 支持 ECMAscript、POSIX、 awk 、grep 和 egrep 表示 法 和 许多 搜索 选项 。 这 是 非 
常 有 用 的 , 特别 是 当 你 需要 使 用 的 正则 式 是 用 其 他 语言 设计 的 时 候 。 如 果 你 需要 了 解 这 些 额 外 的 
特性 , 可 以 查阅 相关 资料 。 不 过 , 请 记 住 ,“ 使 用 最 多 的 特性 "不 是 一 个 好 的 程序 设计 风格 。 无 论 
什么 时 候 , 都 请 替 可 怜 的 程序 维护 人 员 着 想 ( 很 有 可 能 就 是 你 目 己 ), 他 需要 阅读 并 理解 你 的 代 
码 : 因此 编写 代码 时 不 要 炫耀 你 的 聪明 , 并 且 避 免 使 用 那些 上 隐 沁 难 懂 的 特性 。 
23. 8. 1 字符 和 特殊 字符 

一 个 正则 式 描述 了 一 个 模式 , 用 来 在 字符 串 中 查找 匹配 的 字符 。 默 认 情 况 下 , 模式 中 的 一 个 

字符 在 字符 串 中 就 匹配 它 自身 。 例 如 ,正则 式 “abc” 就 匹配 “Is there an abc here? 中 的 abc。 

正则 式 的 强大 来 自 于 具有 特殊 含义 的 “特殊 字符 ”以 及 字符 组 合 : 


特殊 含义 的 字符 
任意 单个 字符 (通配符 ) 
[ 字符 集 
| 计数 
( 子 模式 开始 
) 子 模式 结束 
\ 下 一 个 字符 具有 特殊 含义 
0 个 或 多 个 
+ 一 个 或 多 个 
i 可 选 (0 个 或 一 个 ) 
| 二 选 一 (或 ) 
A 行 的 开始 ; 否定 
$ 行 的 结束 
例如 


XYy 
匹配 任何 以 x 开头 并 且 以 y 结束 的 长 度 为 3 的 字符 串 , 例如 xxy、x3y 和 xay, 但 不 匹配 yxy, 3xy 及 
XYyo 
注意 , |... | 、” 、+ 以 及 ? 是 后 缀 运算 符 。 例 如 ，\d + 表示 “一 个 或 多 个 十 进 制 数字 ”。 
如 果 你 想 在 模式 中 使 用 这 些 特殊 符号 的 普通 字符 含义 , 需要 利用 反 斜 线 进行 “ 转 义 ”。 例 如 ， 
+ 表示 “一 个 或 多 个 "运算 符 ,而 \ + 表示 加 号 。 : 
23. 8.2 字符 集 
最 常用 的 字符 组 合 通常 也 用 特殊 字符 的 简洁 形式 表示 : 
表示 字符 集 的 特殊 字符 . | . 
\d 一 个 十 进 制 数 字 [[: digit: ] ] 
\l 一 个 小 写字 母 . [[:lower: ] ] 
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( 续 ) 
表示 字符 集 的 特殊 字符 
\s 一 个 空白 符 (空格 符 、 制 表 符 等 ) [[: space: ] ] 
\u 一 个 大 写字 母 [[: upper: ]] 
\w 一 个 字母 (a ~z 或 A ~2Z) 或 数字 (0 ~9) 或 下 划 线 (_) [[: alnum: |] ] 
\D 除了 \d 之 外 的 字符 [^[:digit ] ] 
\L 除了 \1 之 外 的 字符 [A[:lower ]] 
\S 除了 \s 之 外 的 字符 [^[:space: ] ] 
\U 除了 \u 之 外 的 字符 [  [: upper: ]] 
\W 除了 \w 之 外 的 字符 [ ^[: alnum: ] ] 


注意 , 大 写 形 式 的 特殊 字符 表示 “除了 对 应 的 小 写 形式 特殊 字符 所 表示 的 字符 之 外 的 所 有 字符 ”。 
特别 地 ，\W 表示 “不 是 一 个 字母 ”而 非 “ 一 个 大 写字 母 ”。 

第 三 列 的 内 容 (如 [[: digit: ] ] ) 是 表示 相同 含义 的 另 一 种 较 长 的 表示 方式 。 

与 string 和 iostream 库 类 似 , regex 库 可 以 处 理 大 字符 集 ， 如 Unicode。 与 前 文 一 样 , 我 们 不 对 
此 进行 详细 介绍 , 需要 时 你 可 以 查找 相关 资料 或 求助 于 有 经 验 的 人 。Unicode 文本 处 理 已 经 超出 
了 本 书 的 讨论 范围 。 : 





23. 8.3 重复 

模式 的 重复 通过 一 些 后 缀 运算 符 来 实现 : 
重复 
{nl 严格 重复 n 次 
jn ,| 重复 n 次 或 更 多 次 
{n,m| 重复 至 少 n 次 ,至 多 m 次 
重复 0 次 或 多 次 , 即 10 ,| 
+ 重复 一 次 或 多 次 , 即 | 1, 
? 可 选 (0 次 或 一 次 ) ， 即 ;0 ,1| 

例如 : 

Ax* 

与 任何 以 A 开始, 后 接 0 或 多 个 x 的 字符 串 匹 配 , 例如 : 

A 

Ax 

Axx 

AXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 

如 果 希 望 字符 至 少 出 现 一 次 , 则 用 + 替换 ”。 例 如 : 

Ax+ 

匹配 那些 以 A 开始 , 后 接 一 个 或 多 个 x 的 字符 串 ， 如 

Ax 

Axx . 

人 AXXOCCXXXXXXXX 

但 不 匹配 

A 


常用 的 出 现 0 次 或 一 次 (“可 选 的 ” ) 的 概念 用 问号 表示 。 例 如 : 
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dd 
匹配 以 破 折 号 分 隔 的 两 个 数字 和 连续 两 个 数字 , 例如 : 


1-2 
12 


但 不 匹配 

1--2 

如 和 需 指 定 特定 的 重复 次 数 , 或 者 一 定 范围 内 的 重复 次 数 , 可 用 花 括号 。 例 如 : 
\w{2}—\d{4,5} 


匹配 以 两 个 字母 (或 数字 、 下 划 线 ) 和 连 字 符 开 始 , 后 接 4 个 或 5 个 数字 的 字符 串 ， 如 
Ab-1234 
XX-54321 
22-54321 


但 不 匹配 
Ab-123 
?b-1234 


注意 , 数字 也 属于 字符 集 \w。 
23. 8. 4 子 模 式 
为 了 指定 模式 中 的 子 模式 , 用 括号 将 其 括 起 来 。 例 如 ; 
Qd"*:) 
它 定 义 了 一 个 子 模式 , 表示 0 或 多 个 数字 后 接 一 个 冒号 。 一 个 复杂 的 模式 可 用 多 个 子 模式 组 成 。 
例如 : 
(dd*:)?Qd+) 
它 表 示 字 符 串 前 半 部 分 可 以 为 空 ,者 非 空 , 则 是 任意 长 度 的 数字 序列 (可 以 为 空 ) 后 接 一 个 冒号 , 后 
半 部 分 是 一 个 或 多 个 数字 的 序列 。 多 么 元 长 的 叙述 ! 难怪 人 们 发 明正 则 表达 式 这 样 一 种 简洁 、 准 
确 的 方法 来 描述 这 些 模式 。 
23. 8.5 可 选项 
“或 "运算 符 (1) 表 示 二 选 一 的 概念 。 例 如 : 
Subject: (FW:|Re:)?(.") 
匹配 主题 行 , 其 中 包含 可 选 的 FW :或 Re:, 后 接 0 个 或 多 个 任意 字符 。 例 如 , 它 匹 配 如 下 字符 串 : 
Subject: FW: Hello, world! 


Subject: Re: 
Subject: Norwegian Blue 


但 不 匹配 : 
SUBJECT: Re: Parrots 
Subject FW: No subject! 


注意 , 或 运算 的 两 个 子 正则 式 均 不 能 为 空 : 

(ldef) /error 

多 个 连续 的 或 运算 是 允许 的 : 

(bs|Bs|bSIBS) . 
23. 8.6 字符 集 和 范围 

前 文 已 经 介绍 了 一 些 表 示 字 符 集 的 特殊 字符 ,如 表示 数字 的 \d, 表示 字母 、 数 字 或 下 划 线 的 
\w 等 (参见 23.7.2 节 )。 不 过 ,有 时 我 们 还 需要 定义 其 他 的 字符 集 , 这 也 很 容易 ,例如 : 

[\w@] 字母 、 数 字 、 下 划 线 、 空 格 或 @ 

[La 一 zj -小 写字 母 a~z 
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[a sh 2 大 写 或 小 写字 母 a~z( 或 A~Z) 

[Pp] 大 写 或 小 写 的 p 

[\w\ -] 字母 、 数字、 下 划 线 或 破 折 号 

[asdfehjkl; ’" ] 美式 QWERTY 键盘 中 间 一 行 上 的 所 有 字符 
句点 


[.[{(\W\* +? $] 所 有 特殊 字符 (这 里 表示 字符 本 身 , 不 是 特殊 字符 的 含义 ) 
在 字符 集中 ，- ( 连 字 符 ) 表示 范围, 如 [1 -3] 表 示 1、2 或 3, [w-zj] 表 示 w、x、y 或 z。 范 
围 的 使 用 一 定 要 很 小 心 : 并 非 所 有 语言 都 具有 相同 的 字母 , 而 且 并 非 所 有 字符 集中 字符 顺序 
都 一 致 。 如 果 你 觉得 要 使 用 的 范围 不 是 最 常见 的 英语 字母 表 中 的 字母 或 者 数字 范围 , 请 查 
阅 相 关 资 料 。 z 

注意 , 我 们 可 以 在 字符 集中 使 用 特殊 字符 , 如 \w。 于 是 产生 一 个 问题 , 如 何 表示 反 斜 线 符 号 ? 
与 往常 一 样 , 对 其 进行 转 义 即 可 ;“\\"。 

如 果 字 符 集 的 第 一 个 字符 是 ^, 则 表示 “ 非 ” 的 概念 。 例 如 : 


[“aeiouy ] 非 问 语 元 音 
[^\d] 非 数 字 
[^aeiouy ] 英语 元 音 或 空格 


在 最 后 一 个 正则 式 中 ,“ 不 是 字符 集中 的 第 一 个 字符 , 因此 它 只 是 一 个 普通 字符 , 而 不 是 非 运 算 
符 一 一 正则 表达 式 就 是 如 此 微妙 。 

regex 的 一 些 实现 中 还 提供 了 一 组 命名 字符 集 。 例 如 , 如 果 和 希望 匹配 字母 数字 符号 ( 即 匹配 一 
个 字母 或 者 一 个 数字 : a-z 或 A-Z 或 0-9), 可 以 使 用 [|[:alnum: ]]。 在 这 里 ，alnum 是 字符 集 
的 名 称 ( 字 母 数 字 字 符 集 )。 于 是 , 加 引号 的 非 空 字母 数字 串 对 应 的 正则 式 为 "[L:amnumjj +"。 
为 了 将 此 正则 式 放 在 程序 中 的 字符 串 内 , 需要 将 引号 转 义 : 

string s = \"[[:alnum:]]+\""; 
而 且 , 在 regex 中 引号 也 是 特殊 符号 。 因 此 为 了 将 字符 串 转换 为 regex 对 象 , 我 们 还 需 再 产生 一 个 
反 斜 线 符 号 , 使 得 在 regex 对 和 象 中 引号 被 转 义 , 而 不 是 表示 特殊 符号 。 男 外 , 我 们 需要 使 用 ( ) 风格 
初始 化 regex， 因为 利用 string 构造 regex 必须 是 显 式 的 : 

regex s(W"[[:alnum:]]N""); 

下 表 列 出 了 一 些 标准 的 命名 字符 集 : 


字符 集 

alnum 任意 字母 数字 

alpha 任意 字母 

blank 任意 空白 符 , 不 包括 换行 
cntrl 任意 控制 字符 

d 任意 十 进 制 数字 

digit 任意 十 进 制 数字 

i 任意 图 形 字符 

lower 任意 小 写字 母 


print 任何 可 打印 字符 
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( 续 ) 
字符 集 
punct 任意 标点 字符 
s 任意 空白 符 
space 任意 空白 符 
upper 任意 大 写字 和 母 
w 任意 单词 字符 (字母 、 数 字 及 下 划 线 ) . 
xdigit 任意 十 六 进 制 数字 字符 


特定 的 regex 实现 可 能 提供 更 多 的 命名 字符 集 , 但 如 果 你 决定 使 用 的 字符 集 不 在 上 表 内 , 一 定 要 
检查 可 移植 性 是 否 足够 好 , 是 否 能 满足 你 最 初 的 需求 。 


23. 8.7 正则 表达 式 错 误 
如 果 你 指定 了 一 个 错误 的 正则 表达 式 , 会 产生 什么 后 果 ? 例 如: 


regex pat1(" (lghi)"); // missing. alternative 
regex pat2("[c-al™); // not a range 


当 我 们 将 一 个 模式 赋予 regex 时 , 它 会 对 模式 进行 检查 ,如 果 发 现 模 式 不 合法 或 者 过 于 复杂 , 无 法 
用 于 匹配 时 , 它 会 抛 出 一 个 bad_expression 异常 。 
下 面 这 有 段 程序 对 体会 正则 表达 式 匹 配 很 有 帮助 : 


#include <boost/regex.hpp> 

#include <iostream> 

#include <string> 

#include <fstream> 

#include<sstream> 

using namespace std; 

using namespace boost;  //if you use the boost implementation 


// accept a pattern and a set of lines from input 
/ check the pattern and search for lines with that pattern 


int main() 
{ 


regex pattern; 


string pat; 
cout << "enter pattern: "; 
getline(cin, pat); // read pattern 


try { 
pattern = pat; / this checks pat 
cout << "pattern: " << pattern << "\n’; 
} 
catch (bad_expression) { 
cout << pat << "is not a valid regular expressionNn'; 
exit(1); 
} 


cout << "now enter jines:\n'; 
string line; / input buffer 


int lineno = 0; 


while (getline(cin,line)) { 
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++jiineno; 
-Smatch matches; 
if (regex_search(line, matches, pattern)) { 
cout << "line " << lineno << ": " <<line << An ; 
for (int i = 0; i<matches.size(); ++)) 
cout << "tmatches{” <<i<<"]:" 
<< matchesti << "\n'; 


} 
else 
cout << "did n't match\n"; 


} 


试 一 试 ” 编译、 运行 这 个 程序 , 尝试 一 些 模 式 , 如 abc、x. x、(.”)、\([^)]*\) 以 
及 \w+ \w+( Jr\. )?。 


23. 9 与 正则 表达 式 进行 模式 匹配 


正则 表达 式 有 两 种 主要 用 途 : 
。 在 (任意 长 的 ) 数 据 流 中 搜索 与 正则 式 匹 配 的 字符 串 
能 , 它 在 数据 流 中 搜索 与 正则 式 匹 配 的 子 串 。 
e 人 
否 完全 匹配 。 
23.6 节 中 给 出 的 搜索 ZIP 的 程序 是 正则 式 搜 索 功 能 的 很 好 示例 。 下 面 ， 我 们 介绍 一 个 匹配 操作 的 
例子 。 例 如 , 我 们 需要 从 像 下 表 这 样 的 结构 中 提取 数据 : 





regex_search( ) 就 可 以 实现 此 功 





regex_match( ) 检查 模式 和 给 定 字 符 串 是 


KLASSE ANTAL DRENGE ANTAL PIGER ELEVER IALT 
0A 12 11 23 
1A 7 8 15 
1B 4 11 15 
2A 10 13 23 
3A 10 12 22 
4A 7 7 14 
4B 10 5 15 
5A 19 8 27 
6A 10 9 19 
6B 9 10 19 
7A 7 19 26 
76 3 5 8 
7I 7 3 10 
8A 10 16 26 
9A 12 15 27 

0MO 3 5 
0P1 1 1 2 
0P2 0 5 5 
10B 4 4 8 
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( 续 ) 

KLASSE ANTAL DRENCE ANTAL PICER ELEVER IALT 
10CE 0 , "ee 1 1 
1MO 8 呈 13 
2CE 8 5 13 
3DCE 3 3 6 
4MO 4 1 5 
6CE 3 4 7 
8CE 4 4 8 
9CE 4 9 13 
REST 5 6 11 
Alle klasser 184 202 386 


这 个 表 记 录 的 是 Bjarne Stroustrup 的 母校 在 2007 年 的 学 生 数 , 它 实际 上 是 从 互联 网 上 提取 出 来 的 ， 
其 原始 格式 看 起 来 很 整洁 , 而 且 正 是 我 们 进行 数据 分 析 时 常见 的 那 种 典型 格式 : 

。 它 包含 数值 域 。 z 

。 它 包含 字符 域 , 其 中 字符 串 只 有 了 解 上 下 文 的 人 才 知 道 其 含义 。( 在 本 例 中 , 这 种 情况 更 

为 明显 ,因为 文字 都 是 丹麦 文 。) 

。 字符 串 中 包含 空格 。 

。 数据 “ 域 ”" 用 “分 隔 符 ”分 开 , 在 本 例 中 , 分 隔 符 为 制 表 符 。 
我 们 选择 的 这 个 例子 “相当 典型 "而 且 “ 不 是 很 困难 ”, 但 有 一 点 比较 微妙 : 人 眼 是 无 法 看 出 空格 和 
制 表 符 之 间 的 区 别 的 , 这 只 能 在 程序 中 进行 区 分 。 

我 们 将 展示 正则 表达 式 的 如 下 用 途 : 

。 验证 表格 布局 是 否 正确 ( 即 是 否 每 行 包含 的 域 的 数目 都 正确 ) 。 

。 验证 合计 值 是 否 正确 (每 列 最 后 一 行 上 的 数值 为 其 上 所 有 数值 之 和 ) 。 
如 果 我 们 可 以 完成 这 些 任 务 , 那么 我 们 就 几乎 能 做 任何 事 ! 例如 , 由 原 表格 创建 出 一 个 新 的 表 
格 : 将 具有 相同 起 始 数字 的 行 (表示 年 级 : 一 年 级 用 1 表示 , 依 此 类 推 ) 合并 在 一 起 , 或 者 分 析 学 
生 数 是 逐年 增长 还 是 减少 (参考 习题 10 和 11) 。 


为 了 对 表格 进行 分 析 , 我 们 需要 两 个 模式 : 一 个 用 于 分 析 表 头 行 , 男 一 个 用 于 分 析 猎 余 行 : 
regex header( "AINw ]+( [Nw ]+)*$"); 
regex row( "^[\w J+( Nd+)( Nd+)( Nd+)$ ); 


请 记 住 , 我 们 一 直 在 称赞 正则 表达 式 简洁 、 功 能 强大 , 但 我 们 从 未 称赞 它 易于 被 初学 者 理解 。 实 
际 上 ,“ 只 写 语言 " 的 名 声 对 正则 式 来 说 是 恰如其分 的 。 我 们 从 表 头 开始 , 由 于 它 (第 一 行 ) 不 包含 
任何 数值 , 将 其 直接 丢弃 即 可 。 但 是 , 为 了 多 做 一 些 练习 , 我 们 还 是 对 其 进行 分 析 。 它 包含 4 个 
由 制 表 符 分 隔 的 “单词 域 "( “字母 数字 域 " ) 。 这 些 域 中 可 以 包含 空格 ， 因 此, 我 们 不 能 简单 地 用 
\w 来 匹配 其 中 的 字符 , 而 应 该 用 [\w ] , 即 一 个 字母 、 数 字 、 下 划 线 或 者 一 个 空格 。 因 此 , 匹配 第 
一 个 域 的 正则 式 为 [ \w ] + 。 我 们 希望 第 一 个 域 在 行 首 , 因此 可 用 ^([\w ] + ) 匹 配 , 符号 ” ”" 表 
示 “ 行 首 ” 的 含义 。 行 中 剩余 域 可 描述 为 一 个 制 表 符 后 接 多 个 单词 : ( [\w ] + )。 现 在 , 我 们 先 给 
出 匹配 任意 多 个 这 种 域 , 最 后 是 行 尾 的 正则 式 : ( [\w ] + ) * $ 。 美 元 符号 ( $ ) 表示 “ 行 尾 ”。 我 
们 将 完整 的 正则 式 写 成 C++ 字符 串 的 形式 ， 如 前 所 述 , 需要 添加 一 些 额外 的 反 斜 线 符号 : 
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1A[Nw]+( (Nw I+)*$" 
注意 ,人 眼 是 看 不 出 制 表 符 和 空格 之 间 的 区 别 的 , 但 在 本 例 中 , 排版 时 已 经 将 制 表 符 展开 了 , 因 
此 可 以 明确 地 区 分 开 来 。 : 

现在 来 看 更 有 趣 的 部 分 : 如 何 为 数值 行 设计 模式 。 如 表 头 行 一 样 , 数值 行 的 行 首 也 是 单词 
域 , 因此 子 正则 式 为 ^[\w ] + 。 后 面 是 三 个 数值 域 , 每 个 域 之 前 是 一 个 制 表 符 :( \d + ) , 因此 ， 
完整 的 正则 式 为 ; 

ANwj+( dt+i( \dt)( dt)$ 

放 入 C++ 字符 串 : 

”"A[Nw ]+( Nd+)( Nd+)( \d+)$" 

现在 , 模式 已 经 设计 完毕 , 下 面 所 要 做 的 就 是 使 用 它们 分 析 表 格 。 首 先 验证 表格 布局 : 


int main() 

‘ 
ifstream in('table.txt"); / input file 
if (tin) error("no input filen”); 


string line; /input buffer 
int lineno = 0; 


regex header("^[Nw ]+( [Nw ]+)*$"); Wiheader line 


regex row( "^[\w ]+( Nd+)( Ndt)( Nd+)$"); / data line 
if (getline(in, line)) { / check header line 


smatch matches; 
if (1regex_match(line, matches, header)) 
error("'no header"); 


while (getline(in,line) {  //check data line 
++lineno; 
smatch matches; 
if (lregex_match(line, matches, row)) 
error( bad line",to_string (tineno)); 
} 
} , 
简洁 起 见 , 我 们 省 略 了 #include。 我 们 的 目的 是 检查 每 行 中 的 所 有 字符 ， 因 此 我 们 使 用 regex_ 
match( ) 而 不 是 regex_search( ) 。 两 者 的 区 别 在 于 , regex_match( ) 需 匹配 输入 中 所 有 字符 才能 判断 
匹配 成 功 , 而 regex_search( ) 只 要 在 输入 中 找到 匹配 的 字 串 即 可 。 如 果 你 想 用 的 是 regex_search( )， 
但 误 输 入 了 regex_match( ) (或 反之 ) , 这 种 错误 将 很 难 查找 出 来 。 不 过 , 两 个 函数 对 参数 的 使 用 是 
相同 的 。 
接 下 来 我 们 对 表 中 的 数据 进行 验证 。 我 们 对 男孩 (“drenge" ) 和 女孩 (“piger”) 两 列 保存 其 学 
生 数 之 和 。 对 每 一 行 , 我 们 检查 最 后 一 个 域 (“ELEVER IALT”) 是 否 等 于 前 两 个 域 之 和 。 最 后 一 
行 (“Alle klasser” ) 的 内 容 是 同 列 中 其 他 数据 的 合计 值 。 为 了 进行 这 些 检查 , 我 们 修改 了 模式 row， 
将 文本 域 设 计 为 于 模式 ， 这样 就 可 以 识别 “Alle klasser” 了 ,例如 : 


int main() 


ifstream in("table.txt"); /input file 
if (!in) error("no input file"); 


string line; // input buffer 
intlineno=0; 


regex header( "ANw ]+( (Nw 1+)*$"); 
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regex row( "'^([\Ww ]+)( Nd+)( Nd+)(  \d+)$"); 


if (getline(in,line)) { // check header line 
boost: :smatch matches; 
if (!boost: :regex_match(line, matches, headen) { 
error( no header'); 
} 
} 


/{ column totals: 

int boys = 0; 

int giris = 0; 

while (getline(in,line)) { 
++lineno; 
smatch matches; 


if (!regex_match (line, matches, row)) 
cerr << "bad line: " << [ineno << An'; 


if (in.e0f()) cout << "at eof\n"; 


// check row: 

int curr_boy = from_string<int>(matches[2]); 

int curr_girl = from_string<int>(matches[3]); 

int curr_total = from_string<int>(matchesI4)); 

if (curr_boy+curr_girl != curr_total) error("bad row sum \n"); 


if (matches[1]=="Alle klasser"){  / lastline 
if (curr_boy != boys) error("boys don't add up\n"); 
if (curr_girl 1= girls) error("girls don't add up\n"); 
if (1(in>>ws).eof()) error("characters after total line"); 
return 0; 


} 
/ update totais: 
boys += curr_boy; 
girls += curr_girl; 


} 


error("didn’'t find total line’'); 


} 
es 与 其 他 行 是 不 同 的 一 一 它 是 其 他 行 之 和 , 我 们 通过 标签 “Alle klasser” 来 识别 
它 。 在 这 一 行 之 后 , 我 们 不 再 接受 任何 非 空白 字符 (使 用 来 自 lexical_cast( ) 的 技术 , 参见 23. 2 
节 ) ,如果 未 找到 这 一 行 (合计 值 ) ， 则 输出 一 个 错误 信息 。 
我 们 使 用 23. 2 节 中 的 from_string( ) 从 数据 域 中 提取 整数 值 。 我 们 已 经 确认 这 些 域 中 只 包含 
数字 ,因此 无 需 检查 这 次 字符 串 到 整数 的 转换 是 否 成 功 。 


23. 10 ”参考 文献 


正则 表达 式 是 一 种 很 流行 , 也 很 有 用 的 工具 。 很 多 程序 设计 语言 都 支持 正则 表达 式 , 其 格式 
也 各 种 各 样 。 其 理论 基础 是 一 种 优美 的 形式 语言 理论 , 其 高 效 的 实现 技术 则 基于 状态 机 。 正 则 表 
达 式 的 全 部 概念 、 基 础 理论 、 实 现 以 及 状态 机 的 一 般 用 法 已 经 超出 了 本 书 的 讨论 范围 。 不 过 ,由 
于 这 些 主 题 都 是 计算 机 科学 课程 中 重要 的 内 容 , 而 正则 式 又 如 此 流行 , 因此 如 果 你 需要 学 习 这 些 
内 容 或 者 仅仅 是 感 兴趣 的 话 , 很 容易 找到 相关 资料 。 一 些 参考 文献 罗列 如 下 : 


Aho, Alfred V., Monica S$. Lam, Ravi Sethi, and Jeffrey D. Ullman. Compilers: Prinaiples, Techniques, and Toobs, 
Second Edihion (usually called “The Dragon Book”). Addison-Wesley, 2007 ISBN 0321547985. 

Austern, Matt, ed. “Draft ‘Technical Report on C++ Library Extensions” ISO/IEC DTR 19768, 2005 
www.open-std.org/jtcl/sc22/wg21/docs/papers/ 2005/n1836.pdf. 
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Boost.org. A repository for libraries meant to work well with the C++ standard libiaryiiwvW.boost.tr. 
Cox, Russ. "Regular Expression Matching Can Be Simple and Fast (but Js Slow in Tava, Perl, PHP, Pythan, Ruby 


. »): http://swtch.com/~rsc/regexp/regexpl.html. 
Maddoc, ]. boost::regex documentation. www.boost.org/libs/regex/doc/index.html. 


Schwartz, Randal L., Tom Phoenix, and Brian D. Foy. Learning Perl, Fourth Edition. O'Reilly, 2005. ISBN 0596- 
101058. 


他》 简单 练习 


1， 确 认 你 的 机 器 上 安装 的 标准 库 是 否 包含 regex。 提 示 : 尝试 使 用 std :: regex 和 trl :: regex。 

2. 编译、 运行 23. 7.7 节 中 的 小 程序 , 可 能 需要 安装 boost :: regex， 并 弄 清 如 何 通过 设置 工程 属性 或 命令 行 选 
项 来 使 用 regex 头 文件 及 链接 regex 库 。 

3. 使 用 上 一 小 题 中 的 程序 测试 23.7 节 中 的 模式 。 


全 ) 思考 题 
. 我 们 在 哪里 查找 “文本 ”? 
. 标准 库 中 哪些 功能 对 于 文本 分 析 非 常 有 用 ? 
.insert( ) 的 插 人 位置 是 其 位 置 (或 迭代 器 ) 之 前 还 是 之 后 ? 
.Unicode 是 什么 ? 
， 如 何 将 字符 串 转换 为 其 他 类 型 ? 反 过 来 呢 ? 
， 假 定 s 是 一 个 字符 串 ,， cin >>s 和 getline( cin,s) 的 区 别 在 哪里 ? 
. 列 出 标准 流 。 
. 一 个 映射 对 象 中 的 关键 字 是 什么 ?给 出 一 些 关 键 字 类 型 的 例子 。 
， 如 何 遍 历 映 射 的 元 素 ? 
10. map 和 multimap 的 差别 在 哪 ? 哪 种 有 用 的 map 的 操作 在 multimap 中 不 存在 ， 多 属国 半 作 你 ? 
11. 向 前 迭代 器 需要 哪些 操作 ? 
12. 空域 和 域 不 存在 有 什么 区 别 ? 给 出 两 个 例子 。 
13， 正则 表达 式 中 为 什么 需要 使 用 转 义 符 ? 
14， 如何 将 正则 表达 式 存 人 regex 变量 ? 
15. \w + \s\d|4| 与 什么 样 的 字符 串 匹 配 ? 给 出 三 个 例子 。 如 果 将 此 模式 转换 为 regex 变量 , 需要 用 什么 样 
的 字符 串 初 始 化 regex 变量 ? 
16. 在 程序 中 , 如 何 确定 一 个 字符 串 是 否 是 合法 的 正则 表达 式 ? 
17，regex_search( ) 的 功能 是 什么 ? 
18，regex_match( ) 的 功能 是 什么 ? 
19， 如 何在 正则 表达 式 中 表示 句点 符号 (. )? 
20， 如 何在 正则 表达 式 中 表示 “至 少 三 个 "的 概念 ? 
21. 字符 7 与 \w 匹配 吗 ? 下 划 线 符号 _ 呢 ? 
22， 如 何在 正则 表达 式 中 表示 大 写字 母 ? 
23， 如 何 自 定义 字符 集 ? 
24. 如 何 从 整数 域 中 提取 数值 ? 
25. 如 何 用 正则 表达 式 表 示 浮 点 数 ? 
26. 如 何 从 匹配 结果 中 提取 浮 点 值 ? 
7. 子 匹 配 是 什么 ?如 何 访 问 子 匹配 结果 ? 


AD 的 = = 


~ 术语 
匹配 regex_match( ) 搜索 
multimap regex_search( ) smatch 


模式 正则 表达 式 子 模式 
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<》 习题 


1. 编译 、 运 行 邮件 文件 分 析 程 序 , 创建 一 个 更 大 的 邮件 文件 来 测试 它 。 一 定 要 加 入 一 些 可 能 触发 错误 的 邮 
件 消息 , 例如 有 两 个 地 址 行 的 邮件 、 多 个 邮件 具有 相同 的 地 址 和 /或 相同 的 主题 、 空 邮 件 等 。 另 外 , 用 一 
些 显然 不 符合 程序 定义 的 邮件 形式 的 内 容 进行 测试 , 例如 , 一 个 不 包含 “ ---- " 行 的 大 文件 。 

2. 添加 一 个 multimap 对 象 , 用 来 保存 主题 。 修 改 程序 , 令 其 从 键盘 接收 一 个 字符 串 , 输出 所 有 主题 与 此 字 
符 串 匹配 的 邮件 。 
3. 修改 23.4 节 中 的 邮件 分 析 程 序 , 使 用 正则 表达 式 查找 主题 和 发 件 人 。 
4. 找 一 个 真正 的 邮件 文件 (包含 真实 邮件 消息 ) , 修改 邮件 分 析 程 序 , 使 其 能 提取 指定 发 件 人 的 邮件 的 主 
题 行 。 
5. 找 一 个 大 的 邮件 文件 (包含 几 千 个 邮件 消息 ) , 测试 用 multimap 输出 所 有 邮件 消息 所 花费 的 时 间 ， 测试 改 
用 unordered_multimap 后 的 时 间 。 注 意 , 我 们 的 应 用 并 未 利用 multimap 的 优点 。 
6. 编写 一 个 程序 ， 从 一 个 文本 文件 中 查找 日 期 。 输 出 包含 日 期 的 行 , 格式 为 “ 行 号 : 行内 容 ”。 以 一 个 简单 
的 日 期 格式 为 起 点 , 如 12/24/2000, 设计 、 测 试 程序 。 随 后 再 加 入 更 多 的 格式 。 
7. 编写 程序 (与 上 题 类 似 的 程序 ), 在 文件 中 查找 信用 卡号 码 。 上 网 搜索 一 下 真实 的 信用 卡号 码 是 什么 
格式 。 
.修改 23. 8.7 节 中 的 程序 ， 使 其 接受 一 个 模式 和 个 文件 名 作为 输入 ， 输出 文件 中 匹配 模式 的 行 ， 输出 格 

式 为 “ 行 号 : 行内 容 ”。 如 果 未 找到 匹配 行 , 则 不 输出 任何 内 容 。 

9. 使 用 eof( ) (参见 附录 B. 7.2) 来 检测 某 行 是 否 是 表格 的 最 后 一 行 。 采 用 这 种 方法 简化 23.9 节 中 的 程序 。 
用 表格 后 接 空 行 的 文件 和 不 以 换行 结束 的 文件 测试 程序 。 

10. 修改 23.9 节 中 的 表格 验证 程序 ,用 原 表格 中 的 数据 创建 并 输出 一 个 新 表格 , 其 中 所 有 首 数字 相同 (同一 
年 级 ) 的 行 被 合并 在 一 起 。 

11. 修改 23.9 页 中 的 表格 验证 程序 , 检查 学 生 数 是 逐年 增加 还 是 减少 。 

12. 基于 习题 6 中 的 程序 , 编写 一 个 新 程序 , 查找 所 有 日 期 并 将 格式 改 为 ISO 标准 格式 yyyy/mm/ dd。 程 序 读 
入 输入 文件 , 转换 日 期 格式 后 将 结果 写 人 输出 文件 。 两 个 文件 内 容 完 全 一 致 ， 只 是 日 期 格式 可 能 不 同 。 

13. 句点 (. ) 与 '\n' 匹 配 吗 ? 编写 一 个 程序 验证 一 下 。 

14. 编写 一 个 程序 , 类 似 23. 8.7 中 的 程序 , 可 以 输入 模式 进行 匹配 。 但 是 ， 它 从 文件 (以 \n' 作 为 行 的 分 隔 ) 
读 取 输 入 , 因此 可 以 测试 跨行 的 模式 。 测 试 这 个 程序 , 并 记录 至 少 一 打 以 上 的 测试 结果 。 

15. 给 出 一 个 不 能 用 正则 表达 式 描 述 的 模式 。 
6. 本 题 不 适合 初学 者 : 证 明 上 题 中 的 模式 确实 不 是 正则 表达 式 。 


3 附 计 
我 们 很 容易 陷入 这 样 一 个 观点 : 计算 机 和 计算 都 是 面 对 数 字 的 , 计算 就 是 数学 的 一 种 形式 。 这 显然 是 
不 正确 的 。 只 要 看 看 你 的 计算 机 屏幕 就 很 清楚 了 , 上 面 充满 了 文本 和 图 片 。 甚 至 说 不 定 它 正在 播放 音乐 呢 。 


对 于 不 同 应 用 , 使 用 适当 的 工具 是 非常 重要 的 一 一 从 C++ 的 角度 , 就 是 要 使 用 适合 的 库 。 对 于 文本 处 理 ， 
正则 表达 式 库 通常 是 关键 工具 一 一 另外 不 要 筷 了 映射 和 标准 库 算 法 。 


OO 


第 24 章 数值 计算 


“每 个 复杂 问题 都 存在 一 个 清晰 、 简 洁 但 是 错误 的 解答 。 
-一 一 由 L Mencken 


本 章 介绍 用 于 数值 计算 的 一 些 基 本 语言 特性 和 标准 库 功能 。 我 们 提出 大 小 、 精 度 以 及 截断 等 
一 些 基本 问题 。 本 章 的 核心 部 分 是 关于 多 维 数值 的 讨论 ， 既 讨论 C 风格 的 多 维 数组 , 也 介绍 N 维 
矩阵 库 。 我 们 还 将 介绍 随机 数 , 它 被 广泛 用 于 测试 、 仿 真 以 及 电脑 游戏 中 。 最 后 ,我们 介绍 标准 
库 数学 函数 , 并 简要 介绍 标准 库 对 复数 的 支持 。 机 


24. 1 介绍 


对 某 些 人 来 说 , 数字 、 数 值 计算 就 是 一 切 ， 比 如 很 多 科学 家 、 工 程 师 以 及 统计 学 家 等 。 对 更 
多 的 人 来 说 , 数值 计算 在 某 些 时 候 是 必要 的 。 例 如 , 一 个 计算 机 科学 家 偶尔 与 一 个 物理 学 家 合作 
时 , 就 属于 这 种 情况 。 而 对 于 大 多 数 人 来 说 , 很 少 会 用 到 数值 计算 (不 是 整数 和 浮 点 数 的 简单 算 
术 运 算 ， 而 是 更 复杂 的 计算 ) 。 本 章 的 目的 是 介绍 一 些 用 于 处 理 简单 数值 计算 问题 的 程序 设计 语 
言 技术 细节 。 我 们 不 会 介绍 数值 分 析 或 者 浮 点 数 运算 的 微妙 难 懂 之 处 , 这 些 内 容 已 经 远 远 超 出 了 
本 书 的 讨论 范围 , 而 且 与 应 用 中 领域 相关 的 问题 是 紧密 融合 的 。 本 章 主 要 讨论 如 下 问题 : 

。 一 些 内 置 类 型 是 有 固定 大 小 , 由 此 引发 的 精度 、 溢出 等 问题 。 

。 数组 : 内 置 的 多 维 数组 类 型 和 更 适 于 数值 计算 的 Matne /Es 

。 随机 数 的 最 基本 的 概念 

。 标准 库 中 的 数学 函数 。 

。 复数 。 

其 中 Matrix 库 是 重点 , 它 使 矩阵 ( 多 维 数组 ) 的 处 理 变 得 简单 。 


24.2 大小、 精度 和 溢出 


当 我 们 使 用 内 置 类 型 和 普通 计算 技术 时 ， 数值 会 占用 固定 大 小 的 内 存 。 也 就 是 说 , 整数 
类 型 (int、long 等 ) 只 是 数学 上 的 整数 的 近似 。 同 样 ， 浮上 扣 数 类 型 (float、 double 等 ) 也 只 是 数 
学 上 的 实数 的 近似 。 这 意味 着 , 从 数学 的 角度 看 , 某 些 计算 机 中 的 计算 是 不 精确 的 , 其 至 是 
错 的 , 例如 ; 


float x = 1.0/333; 

float sum = 0; 

for (int i=0; i<333; ++j) sum+=Xx; 

cout << setprecision(15) << sum << "\n"; 


执行 这 段 代码 , 一些 人 很 天 真 地 期 望 得 到 1, 但 实际 得 到 的 结果 是 

0.999999463558197 
这 就 是 我 们 所 期 待 的 结果 ,因为 我 们 了 解 计 算 机 数值 计算 一 一 这 就 是 一 个 截断 误差 的 例子 。 在 计 
算 机 中 , 一 个 浮 点 数 只 占用 固定 数目 的 二 进 制 位 , 因此 我 们 总 是 可 以 “欺骗 ”计算 机 : 让 它 做 一 个 
运算 ,其 结果 需要 更 多 的 二 进 制 位 来 保存 。 例 如 ,有理 数 1/3 是 无 法 用 十 进 制 数 精确 表示 的 (无 
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论 我 们 使 用 多 少 位 十 进 制 数字 都 不 能 ) 。1/333 也 是 如 此 , 于 是 , 当 我 们 将 x( 计算 机 中 与 1/333 最 
为 接近 的 浮 点 数值 ) 累加 333 次 时 , 我 们 得 到 是 与 1 有 微小 差距 的 一 个 值 。 每 当 我 们 进行 大 量 浮 
点 数 运算 时 ， 就 会 产生 截断 误差 ,唯一 的 问题 是 误差 对 结果 的 影响 是 否 严 重 。 

要 时 时 检查 计算 结果 是 否 合理 。 当 进行 计算 时 ,你 必须 清楚 什么 是 “合理 的 结果 ”, 否则 就 很 
容易 被 < 愚蠢 的 错误 ”或 者 计算 误差 所 愚弄 。 要 保持 对 截断 误差 的 警惕 ,如果 有 妖 问 , 一定 要 请 教 
专家 或 者 仔细 研究 数值 计算 的 相关 资料 。 

试 一 试 将 上 例 中 的 333 改 为 10, 重新 运行 程序 。 你 预计 会 得 到 什么 结果 ? 实际 得 到 了 什么 

结果 ? 我 们 早已 警告 过 你 了 ! 

相对 于 实数 , 用 固定 位 数 表示 整数 所 引起 的 问题 更 为 引 人 注 目 。 原 因 在 于 , 浮 点 数 被 定 
义 为 实数 的 近似 ,因此 后 果 是 丢失 精度 ( 即 丢失 最 低 有 效 位 ) ,而 整数 则 是 引起 溢出 ( 即 丢 失 
最 高 有 效 位 ) 。 因 此 , 浮 点 数 运算 的 误差 总 是 比较 细微 , 不 易 被 初学 者 察觉 , 而 整数 的 误差 
则 往往 非常 惊人 , 很 难 不 被 注意 。 请 记 住 , 我 们 希望 错误 更 早 地 、 更 突出 地 显现 出 来 ,以 便 
能 及 时 修正 。 

看 看 下 面 的 程序 : 

short inty = 40000; 


inti = 1000000; 
| cout <<y<<" 委 <c ij << INnna， 


其 输出 结果 为 : 

-25536 -727379968、 
这 就 是 典型 的 溢出 现象 。 我 们 当然 希望 能 表示 任意 整数 值 ， 以 获得 准确 的 计算 结果 。 但 计算 机 中 
的 整 型 只 能 表示 (相对 ) 较 小 的 整数 , 其 宽度 不 足以 精确 表示 所 有 整数 。 在 本 例 中 , 一 个 两 个 字 节 
的 shor 类 型 不 能 表示 40 000 ,而 一 个 4 个 字 节 的 int 类 型 不 能 表示 .1 000 000 000 000。C++ 内 置 
类 型 的 准确 宽度 依赖 于 硬件 平台 和 编译 器 (参考 附录 A. 8) 。 我 们 可 以 使 用 sizeof( x) 来 获得 x 的 宽 
度 (以 字 节 为 单位 ), x 可 以 是 一 个 变量 或 者 一 个 类 型 。 由 定义 得 到 sizeof( char) ==1。 一 些 常 见 
类 型 的 大 小 如 右 图 所 示 。 这 是 在 Windows 平台 上 , 使 用 微软 cpar 机 
编译 器 时 类 型 的 宽度 。 对 于 整数 和 浮 氮 数 ,C++ 都 提供 了 不 
同 宽度 的 类 型 。 但 除非 有 很 好 的 理由 ,否则 最 好 只 使 用 
char 、int 和 double 这 几 个 标准 宽度 的 类 型 。 在 大 多 数 程序 中 
(当然 不 是 所 有 ) ， 其 他 整数 和 浮 人 比 带 
来 的 好 处 更 多 。 

你 可 以 将 一 个 整数 赋予 一 个 浮 点 数 。 如 果 整 数 信 超 出 了 浮 点 类 型 的 表示 范围 , 则 会 丢失 精 
度 , 例如 : 


cout << "sizes: " << sizeof(int) << '' << sizeof(float) << \n'; 
int x = 2100000009; /large int 

float f = x; 

cout <<x <<'' <<f << endl; 

cout << setprecision(15) <<x <<'' <<f<<"\n'; 


在 我 们 的 计算 机 上 , 输出 结果 为 : 
Sizes: 44 
2100000009 2.1e+009 
2100000009 2100000000 


goat 类 型 和 int 类 型 占用 相同 大 小 的 内 存 空间 (4 个 字 节 ) 。 一 个 loat 信和 由 一 个 “尾数 "a( 通常 是 0 
和 1 之 间 的 一 个 数 ) 和 一 个 指数 b 组 成 (a*10*), 因此 无 法 准确 表示 最 大 的 int 值 (如 果 我 们 想 把 
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最 大 int 的 准确 值 存 人 一 个 float 值 中 , 尾数 已 经 占用 了 所 有 空间 , 指数 根本 没有 位 置 存放 了 ) 。 因 
此 在 上 例 中 , { 只 能 保存 尽量 接近 2 100 000 009 的 值 , 对 于 最 后 一 个 9 它 已 经 无 能 为 力 了 , 这 就 是 
输出 结果 是 2 100 000 000 的 原因 。 

另 一 方面 , 如果 你 将 一 个 浮 点 数 赋予 一 个 整数 , 会 导致 截断 ， 即 小 数 部 分 (小 数 点 之 后 的 数 
字 ) 被 简 音 丢弃。 例如: 


float f = 2.8; 
int x = ff; 
cout <<x << <<f<< n'y 


x 的 值 会 是 2, 而 不 是 3 一 一 这 里 并 不 是 进行 “四 舍 五 人 ”。C ++ 中 float 转换 为 int 采用 的 是 截断 而 
非 伟人。 

当 进 行 计算 时 ， 你 必须 清楚 可 能 会 发 生 的 溢出 和 截断 。C++ 不 会 捕获 这 些 问题 , 考虑 下 面 的 
程序 : 


void f(int i, double fpd) 
{ 


char c= i; // yes: chars really are very small] integers 
short s = ji; // beware: an int may not fit in a short int 
i= i+1; // what if i was the largest int? 
long lg = ii; // beware: a long may not be any larger than an int 
fioat fps=fpd;  //beware:a large double may not fit in a float 
i = fpd; //truncates: e.g., 5.7 -> 5 
fps = i; lf you can jose precision (for very jarge jnt values) 
) | 
void g() 


{ | 
char ch=0; 
for (int i = 0; i<500; ++i) 
cout << int(ch++) << Nb; ， 


} 
如 果 对 这 段 程序 有 疑问 , 尝试 运行 它 ! 对 这 类 问题 , 垂头丧气 或 者 仅仅 依赖 文档 都 是 不 可 取 的 ， 
实验 是 最 好 的 方法 ! 

试 一 试 运行 g()。 修 改 f(), 打印 c、s、i 等 。 用 不 同 的 值 来 测试 这 个 函数 。 

我 们 在 25. 5. 3 节 中 还 会 更 详细 地 介绍 各 种 整数 类 型 及 它们 之 间 的 转换 。 如 有 可 能 , 应 该 a 
用 尽 可 能 少 的 类 型 , 这 会 减少 混乱 。 例 如 , 如 果 在 程序 中 只 使 用 double, 而 不 用 float, 就 减少 了 
能 的 double 到 float 的 转换 问题 。 实 际 上 ， 我 们 倾 向 于 只 使 用 int、double 和 complex( 参见 24. 8 
进行 算术 计算 , 只 使 用 char 用 于 字符 处 理 , 而 bool 用 于 逻辑 运算 , 除非 迫不得已 ,否则 不 使 用 其 
他 类 型 。 
24. 2.1 数值 限制 

每 种 C++ 的 实 现 都 在 < limits > 、< limits. h > 而 <float. h > 中 指 征明 了 内 置 类 型 的 属性 ， 因此 程 
序 员 可 以 利用 这 些 属性 来 检查 数值 限制 、 设 置 哨兵 机 制 等 。 附 录 B. 9. 1 中 列 出 了 这 些 值 , 它们 对 
于 开发 低层 程序 是 非常 重要 的 。 如 果 你 党 得 需要 这 些 属性 值 ， 人 比较 靠近 硬 
件 。 但 这 些 属性 还 有 其 他 用 途 , 例如 , 对 语 言 实现 细节 感到 好 奇 是 很 正常 的 :“ 一 个 int 有 多 大 ?” 
或 “char 是 有 符号 的 吗 ?” 希 望 从 系统 文档 中 找到 这 些 问 题 的 正确 管 案 是 很 困难 的 ,, 而 C++ 标准 对 
这 类 问题 大 多 没有 明确 规定 。 较 好 的 办 法 是 写 一 个 简短 的 小 程序 来 获得 这 些 间 题 的 答案 , 如 下 
所 示 : | 
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cout << "number of bytes in an int: " << sizeof(int) << \n'; 
cout << "largest int: " << INT_MAX << endl; 
cout << "smallest int value: " << numeric limits<int>: : min() << \n'; 


if (numeric_ jimits<char>: :is_signed) 
Cout << "char is signed\n"; 
else 
cout << "char is unsigned\n"; 


cout << "char with min value: " << numeric limits<char>:: min() << \n ; 
cout << "min char value: " << int(numeric_ limits<char>::min(0) << \n'; 


如 果 你 编写 的 程序 将 来 要 用 在 多 种 硬件 平台 上 , 那么 能 在 程序 中 获取 上 面 这 些 信息 就 非常 有 价值 
了 。 另 一 种 方法 是 将 这 些 信息 硬 编码 到 程序 中 , 但 这 对 维护 人 员 来 说 是 灾难 性 的 。 
这 些 属性 值 对 溢出 检测 也 是 很 有 用 的 。 


24.3 数组 


数组 (array ) 束 是 一 个 元 素 序 列 ， 我 们 可 以 通过 下 标 ( 位 置 ) 来 访问 元 素 。 我 们 通常 也 把 这 种 
数据 结构 称 为 向 量 。 我 们 特别 关注 的 一 种 数组 是 : 每 个 元 素 本 身 也 是 一 个 数组 , 即 多 维 数组 , 通 
常 也 称 为 矩阵 。 术 语 的 多 样 性 是 一 个 概念 的 流行 程度 和 使 用 广泛 程度 的 标志 。 标 准 库 中 的 vector 
(参见 附录 B. 4)、array( 参 见 20.9 节 ) 和 内 置 数组 类 型 (参见 附录 A. 8.2) 都 是 一 维 的。 那么 , 如 果 
我 们 需要 二 维 数组 (比如 矩阵) 的话, 应 该 怎么 办 ? 如 果 我 们 需要 七 维 数组 呢 ? 

我 们 可 以 将 一 维和 二 维 数 组 想象 为 如 下 结构 : 


Ed 一 个 向 量 (Matrix<int> (4)) 也 称 为 
i ey St 人 Wk | > 
0 _ 人 一 维 数组 ， 或 者 一 个 1XN 息 隆 , 











. 一 个 3X4 和 矩阵 (如 Matrix<int2>>m(3,4)， 
也 称 为 一 个 二 维 数组 


数组 对 于 大 多 数 计算 问题 (“数值 运算 ”) 来 说 都 是 非常 重要 的 数据 结构 ,很 多 有 趣 的 科学 计 
算 、 工 程 计算 、 统计 运算 以 及 金融 计算 都 极 大 地 依赖 于 数组 。 
我 们 通常 把 数组 看 做 行 和 列 组 成 的 结构 ,如 下 所 示 : 


一 列 
村 加 一 个 3X4 算 阵 ,也 称 为 
; ; 一 个 二 维 数组 

3 行 

4 列 





一 列 就 是 x 坐标 相同 的 元 素 的 序列 , 一行 就 是 y 坐标 相同 的 元 素 的 序列 。 
24. 4 C 风格 的 多 维 数组 


利用 C++ 内 置 的 数组 类 型 也 可 创建 多 维 数组 ,方法 是 将 多 维 数 组 简单 地 看 做 数组 的 数组 , 即 
数组 的 元 素 也 是 数组 。 例 如 ; 
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int ai[4]; 让 1-dimensional array 
double ad[3][4]; // 2-dimensional array 
char ac[3][4][5]; /3-dimensional array 
ai[1] = 7; 

ad[2][3] = 7.2; 

ac[2][3][4] = "c'; 


这 种 方法 继承 了 一 维 数组 的 优点 和 缺点 : 
e 优点 
a 直接 映射 到 硬件 。 
a 低层 操作 效率 高 。 
a 语言 直接 支持 。 
e 缺点 
a C 风格 的 多 维 数组 是 数组 的 数组 ( 见 下文 )。 
s 大 小 是 固定 的 ( 即 在 编译 时 就 固定 下 来 ) 。 如 果 希 望 在 运行 时 再 确定 大 小 , 就 必须 使 用 动 
态 内 存 分 配 。 
a 不 能 干净 地 传递 数组 参数 ， 只 能 转换 为 指向 其 首 元 素 的 指针 。 
s 没有 越界 检查 。 通 常 , 数组 不 知道 它 自己 的 大 小 。 
s 没有 数组 的 整体 运算 , 甚至 没有 赋值 (拷贝 )。 
内 置 数组 类 型 广泛 用 于 数值 计算 , 但 同时 也 是 造成 程序 错误 和 程序 过 于 复杂 的 主要 原因 。 对 于 大 
多 数 人 来 说 , 编写 和 调试 使 用 内 置 数 组 的 程序 都 是 很 痛苦 的 。 如 果 你 不 得 不 使 用 内 置 数组 , 请 查 
找 相关 资料 (如 《The C++ Programming Language》 的 附录 C, 836 ~ 840 页 )。 不 幸 的 是 , C++ 使 用 
与 C 相同 的 内 置 多 维 数组 , 因此 还 有 很 多 “在 别处 "的 代码 在 使 用 这 种 数组 。 
内 置 数 组 最 大 的 问题 是 不 能 干净 地 传递 多 维 数组 参数 ,必须 转 而 使 用 指针 ,并 显 式 计算 数组 
元 率 位 置 。 例 如: 


void fi1(int a[3][5])， 1 useful for [3][5] matrices only 
void f2(int [ J[5], int dim1); 1 1st dimension can be a variable 
void f3(int [5 J[ ], int dim2); I error: 2nd dimension cannot be a variable 


void fa(int[ JE ], int dim1, int dim2); //error (and wouldn't work anyway) 
void f5(int* m, int dim1, int dim2) //odd, but works 


for (int i=0; i<dim1; ++i) 
for (intj = 0; j<dim2; ++j) m[i*dim2+j] = 0; 

} 
在 这 段 程序 中 , 虽然 m 是 一 个 二 维 数组 , 但 我 们 只 能 将 它 作为 int” 类 型 的 参数 来 传递 。 只 要 数组 
的 第 二 维 大 小 是 可 变 的 (作为 一 个 参数 ) ,就 无 法 告知 编译 器 参数 m 是 一 个 (diml, dim2) 数 组 , 而 
只 能 传递 指向 其 起 始 地 址 的 指针 。 表 达 式 m[ i * dim2 +jj] 实 际 就 表示 mli, jj , 但 由 于 编译 器 不 知 
道 m 是 一 个 二 维 数组 , 我 们 不 得 不 显 式 计算 mLi, jj 在 内 存 中 的 位 置 。 

以 我 们 的 观点 来 看 , 这 太 麻 烦 、 太 原始 , 也 太 容 易 出 错 了 。 而 且 运 行 速度 也 可 能 会 很 惕 ， 因 
为 显 式 计算 元 紊 地 址 会 使 代码 优化 更 为 复杂 。 因 此 , 我 们 不 再 介绍 内 置 多 维 数组 , 而 是 重点 讨论 
Matrix 库 中 的 多 维 数组 机 制 , 它 没有 上 述 缺 点 。 


24. 5 Matrix 库 
如 果 以 数值 计算 为 目标 的 话 , 我 们 到 底 希 望 从 数组 /和 矩阵 库 中 获得 什么 呢 ? 
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“程序 中 使 用 数组 的 方式 应 该 与 数学 /工程 教科 书 上 对 数组 的 使 用 方式 相近 ” 
= 向 量 、 和 矩阵 、 张 量 等 
具备 编译 时 和 运行 时 检查 功能 
。 支持 任意 维 数组 
= 支持 每 一 维 任 意 多 个 元 素 
数组 是 真正 的 变量 /对 象 
= 可 以 作为 参数 传递 
支持 常见 的 数组 运算 
a 下 标 :() 
a 子 数组 ;|[ | 
e 赋值 : = 
= 标量 运算 ( +=、-= 、*=、% = 等 ) 
s 融合 的 向 量 运算 (如 res[i] =a[i] *c+b[2]) 
= 点 积 (res =a[i] *b[i] 的 和 , 也 称 为 内 积 ) 

。 将 传统 的 数组 /向 量 的 概念 转换 为 代码 , 这 些 代码 要 是 你 自己 来 写 的 话 ,会 花费 极 大 的 精 

力 , 而 且 效 率 也 不 会 比 现在 的 更 好 。 

。 如 果 需 要 , 你 可 以 扩展 它 ( 也 就 是 说 , 库 的 实现 没有 使 用 什么 “魔法 ”) 。 
Matrix 实现 了 上 述 功能 , 也 只 实现 了 这 些 。 如 果 你 需要 更 多 功能 ,例如 高 级 的 数组 函数 、 稀 朴 数 
组 、 控制 内 存 布 启 等 , 可 以 自己 编写 相应 的 程序 或 者 选用 一 个 更 接近 你 要 求 的 库 ( 第 二 种 方式 更 
好 些 ) 。 但 是 , 很 多 这 些 “ 高 级 ”功能 可 以 通过 在 Matiix 之 上 构造 算法 和 数据 结构 来 实现 。Matrix 
库 不 是 ISO C++ 标准 库 的 一 部 分 。 你 可 以 在 课程 网 站 上 找到 Matrix. h, 整个 库 定义 在 名 字 空 间 
Numeric_lib 中 。 我 们 选择 “矩阵 ”作为 库 的 名 字 , 是 因为 “向 量 " 和 “数组 "在 C++ 标准 库 中 已 经 用 
得 太 多 了 。 在 英语 中 , 矩阵 matrix 的 复数 形式 是 matrices ，matrixes 也 是 正确 的 , 但 很 少 使 用 。 由 
于 “Matrix” 指 的 是 一 个 C++ 语言 实体 ， 因此 在 本 书 的 英文 原版 中 使 用 Matrixes, 以 避免 混 消 。 Ma- 
trix 库 的 实现 使 用 了 一 些 高 级 技术 , 因此 我 们 不 会 对 此 进行 介绍 。 
24. 5. 1 ”矩阵 的 维和 和 抢 阵 访问 

考察 下 面 的 简单 例 程 : 


#include "Matrix.h" 
using namespace Numeric_lib; 


void f(int n1, int n2, int n3) 


Matrix<double, 1> adioTD; // elements are doubles; one dimension 
Matrix<int,1> ai1(n1)， // elements are ints; one dimension 
ad1(7) = 0; // subscript using ( ) 一 Fortran style 
ad1[7J= 8; HH [jalso works 一 Cstyle 


Matrix<double,2> ad2(n1n2); | //2-dimensional 
Matrix<doubie,3> 人 n3); //3-dimensional 
ad2(3,4) = 7.5; Witrue muttidimensional subscripting 
ad3(3,4,5) = 9.2; 
} 


可 以 看 到 , 你 可 以 定义 Matrix 对 象 , 指定 元 素 类 型 以 及 维 数 。 显 然 ， Matrix 是 一 个 模板 , 元 素 类 型 
和 维 数 是 模板 参数 。 给 定 Matrix 两 个 模板 参数 (如 Matrix < double, 2 > ) 后 , 就 得 到 一 个 具体 类 型 
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(类 ) , 你 可 以 利用 它 来 定义 对 象 (如 Matrix < double, 2 > ad2(nl, m2))， 其 中 的 参数 指定 了 和 矩阵 
的 维 。 这 样 就 定义 了 一 个 二 维 数组 ad2 , 两 个 维度 的 大 小 分 别 为 nl 和 zm2。 我 们 可 以 使 用 下 标 操作 
从 Matrix 中 获取 元 素 , 对 于 一 维 Matrix, 指定 一 个 下 标 即 可 ; 对 于 二 维 Matrix， 需 指 定 两 个 下 标 ; 
依 此 类 推 。 

与 内 置 数 组 类 型 和 vector 相似 ， Matrix 的 下 标 是 从 0 开始 的 (Fortran 语言 从 1 开始 )。 也 就 是 
说 ，Matrix 元 素 的 下 标 范 围 是 [0, max), 其 中 max 是 元 素 总 数 。 

这 种 方式 很 简单 , 而且“ 完全 出 自 于 教科 书 ”。 如 果 你 对 这 点 有 疑问 , 你 可 以 查阅 适合 的 数学 
教科 书 , 而 不 是 程序 设计 手册 。 这 里 唯一 的 “小 聪明 ”是 ， 你 可 以 省 略 维 数 : 默认 值 是 一 维 数组 。 
注意 , 下 标 操作 既 可 以 使 用 [ ] (C 和 C++ 风格), 也 可 以 使 用 ( ) ( Fortran 风格 ) , 这 使 我 们 能 更 好 
地 处 理 多 维 数组 。[x] 下 标 运算 符 最 多 接受 一 个 下 标 , 得 到 矩阵 的 一 行 ; 如 果 a 是 n 维 矩 阵 ， 则 
a[x] 为 nm-1 维 矩阵 。(x，y， 7) 运算 符 接受 一 个 或 多 个 下 标 ， 得 到 矩阵 的 一 个 元 素 ， 下 标的 数目 必 
须 与 维 数 相等 。 

下 面 程序 给 出 了 Matrix 的 一 些 错误 用 法 : 


void f(int n1, int n2, int n3) 
{ 


NMatrix<int,0> ai0; Werror no OD matrices 


Matrix<double,1> ad1(5); 
Matrix<int,1> ai(5); 
Matrix<double,1> ad11(7); 


ad1(7) =0; /Matrix_error exception (7 is out of range) 
ad1 = ai; / error: different element types 
ad1=ad11; //Matrix_error exception (different dimensions) 


Matrix<double,2> ad2(n1); /error: length of 2nd dimension missing 
ad2(3) = 7.5; // error: wrong number of subscripts 
ad2(1,2,3) = 7.5; // error wrong number of subscripts 


Matrix<double,3> ad3(n1,n2,n3); 
Matrix<double,3> ad33(n1,n2,n3); 
ad3 = ad33; // OK: same element type, same dimensions 


} 
一 种 错误 是 声明 的 维 数 与 使 用 的 维 数 不 符 , 这 种 错误 会 在 编译 时 被 捕获 。 而 范围 错误 则 在 运行 时 
被 捕获 , 程序 会 抛 出 一 个 Matrix_error 异常 。 

二 维和 矩阵 的 第 一 维 是 行 , 第 二 维 是 列 , 因此 可 用 (row，col- af1][2] 
umn) 来 索引 二 维和 矩阵 (二 维 数组 )。 也 可 以 使 用 [ row] [ column ] ， 而 
因为 对 于 二 维 矩 阵 , 使 用 单个 下 标 会 得 到 一 个 一 维和 矩阵 ( 行 ) ， 如 
石 图 所 示 。 此 和 矩阵 在 内 存 中 以 “ 行 主 次 序 ” 存 放 : 








一 个 Matrix 对 象 是 “知道 ”自己 的 维 数 和 每 维 大 小 的 , 因此 ， oe 
单 的: 


void init(Matrix<int,2>& a) // initialize each element to a characteristic value 
‘ : l 
for (int i=0; j<a.dim10; ++i) 
for (intj = 0; j<a.dim20; ++j) 
ali,j) = 10*i+j; 
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} 
void print(const Matrix<int,2>& a) // print the elements of a row by row 


for (int i=0; i<a.dim1(); ++i) { 
for (int j = 0; j<a.dim2(); ++j) 
cout << a(i,j) <<\t'; 
cout << \n'; 
} 
} 


可 以 看 到 , diml( ) 返回 第 一 维 的 元 素数 目 ，dim2( ) 为 第 二 维 的 元 素数 目 , 依 此 类 推 。 元 素 类 型 和 
维 数 是 Matrix 类 型 的 一 部 分 , 因此 函数 参数 不 能 是 任意 Matrix( 但 模板 参数 可 以 ) : 

void init(Matrix& a); Verror: element type and number of dimensions missing 
注意 ，Matrix 库 不 支持 矩阵 整体 运算 ,如 将 两 个 四 维和 矩阵 相 加 , 或 者 将 一 个 二 维和 矩阵 和 一 个 一 维 
和 矩阵 相 乘 。 为 这 些 运算 设计 优美 而 高 效 的 算法 超出 了 当前 这 个 库 的 范围 , 但 我 们 可 以 在 Matrix 库 
之 上 设计 这 些 算法 (参见 习题 12) 。 
24. 5.2 一 维和 矩阵 

我 们 可 以 对 最 简单 的 Matrix 一 一 一 维 Matrix 进行 什么 操作 呢 ? 

如 前 所 述 , 声明 时 可 以 省 略 维 数 : 


Matrix<int,1> a1(8); //al isa 1D Matrix of ints 
Matrix<int> a(8); /means Matrix<int,1> a{ 8); 


即 a 和 al 是 相同 的 类 型 ( Matrix <int, 1 > )。 我 们 可 以 获取 矩阵 的 大 小 (元 素 总 数 ) 和 每 一 维 的 大 
小 (一 维 中 的 元 素数 目 ) ， 对 于 一 维 矩 阵 , 这 两 个 值 显然 是 相同 的 : 


a.size(); AH number of elements in Matrix 
a.dim1(); // number of elements in 1st dimension 


我 们 可 以 按 内 存 中 的 实际 布局 获取 元 素 ， 即 获得 指向 第 一 个 元 素 的 指针 : 

int* p = a.data(); // extract data as a pointer to an array 
如 果 希 望 将 Matrix 对 象 传递 给 只 接受 指针 参数 的 C 风格 的 函数 , 这 个 操作 是 很 有 用 的 。 我 们 可 以 
像 下 面 代码 这 样 对 矩阵 进行 下 标 操作 : 


a(li); /With element (Fortran style), but range ch eoled 
alil; /ith element (C style), range checked 
a(1,2); // error: a is a 1D Matrix 


一 些 算法 常常 需要 访问 子 和 矩阵 ，slice( ) 就 完成 这 一 功能 , 它 有 两 种 形式 : 
a.slice(i); // the elements from afil to the last 
a.slice(li,n); /the n elements from ali] to a[i+n-1] 


下 标 和 子 矩阵 操作 既 可 以 作为 右 值 , 也 可 以 作为 左 值 , 因为 它们 直接 指向 矩阵 的 元 素 ,而 不 是 创 
建 拷贝 。 例如 : 


a.slice(4,4) = a.slice(0,4);  //assign first half of a to second haif 


如 果 a 的 初 值 为 
{12345678} 
则 执行 这 条 语句 后 , a 变 为 ， 
{12341234} gs 
注意 , 最 常用 的 子 矩 阵 是 “开始 元 素 段 "和 ”末尾 元 素 段 "， 即 a slice (0, j) (区 域 [0:j)) 和 
a. slice(j)( 区 域 [j:a. size( ) ) )。 特 别 地 ， 上面 那 条 语句 可 以 写 为 : 


a.slice(4) = a.slice(0,4); // assign first half of a to second half 
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也 就 是 说 , 语法 的 设计 上 更 倾向 于 常用 情况 。 你 可 以 指定 超出 a 的 范围 的 1 和 n 的 值 , 但 最 终 的 
结果 只 取 a 的 有 效 范围 内 的 那 段 。 例 如 ，a. slice(i，a. size( ) ) 实际 得 到 范围 是 [i:a. size( ) ) 而 
a. slice(a. size( ) ) 和 'a. slice(a. size( ) , 2 ) 得 到 的 则 是 空 短 阵 。 对 于 很 多 算法 来 说 , 这 一 特性 在 某 
些 时 候 是 很 有 用 的 。 这 个 特性 实际 上 是 从 数学 领域 借鉴 来 的 。 显 然 , a. slice(i, 0) 是 空 的 , 我 们 
不 会 故意 写 出 这 样 的 代码 , 但 算法 中 使 用 a. slice(i, n) 而 n 恰巧 为 0 的 情况 是 很 可 能 出 现 的 。 如 
有 果 此 时 能 得 到 空 矩阵 而 不 是 产生 一 个 错误 的 话 , 算法 可 以 更 为 简洁 。 

Matrix 也 支持 (对 C++ 对象 来 说 ) 常 见 的 拷贝 操作 , 实现 所 有 元 素 的 复制 : 


Matrix<int>a2=a;  // copy initialization 


a= a2; / copy assignment 
我 们 可 以 对 和 矩 阵 中 每 个 元 床 进 行 相同 的 内 置 运算 (标量 运算 ): 
a *=7; / scaling: afi]*=7 for each i (also +=, ~=, /=, etc.) 
a=7; /1 alij=7 for each i a 
只 要 元 率 类 型 支持 , 其 他 赋值 运算 符 和 组 合 赋值 运算 符 ( = 、+= 、/=、*=、%=、”=、 
&=、1=、>>=、<<= ) 也 都 可 以 这 样 使 用 。 我 们 还 可 以 对 短 阵 每 个 元 素 执行 相同 的 函数 
a.apply(f); / alil=f(ali]) for each element alil 
a.apply(f,7); / alil=f(a{i],7) for each element ali] 


组 合 赋值 运算 符 和 函数 apply( ) 都 修改 了 Matrix 中 的 元 素 , 如 果 你 不 希望 这 样 而 是 希望 创建 一 个 
新 的 Matrix 对 和 象 保存 运算 结果 ， 可 以 这 样 做 : 

b = apply(abs,a); I make a new Matrix with b(i)==abs(a(i)) 
其 中 的 abs 是 标准 库 中 的 绝对 值 函 数 (参见 24.8 节 ) 。 本 质 上 , apply(f, x) 与 x apply(f) 相对 应 
而 + 与 += 对应。 例如 : 


b = a*7; /bl{i] = ali]*7 for each j 
a*=7; /af = ali]*7 for each ji 
y= apply(f,x); 1 yli] = f(x{i]) for each i 
x.apply(f); /1/ x[i] = f(x{i]) for each i 


其 运行 结果 为 a==b 且 x==y。 

在 Fortran 中 , 第 二 个 版 本 的 apply 称 为 “广播 "函数, 通常 写作 fx) 而 不 是 apply(f, x)。 为 了 
使 这 一 特性 对 任意 函数 节 都 适用 (而 不 是 像 Fortran 中 那样 ， 只 对 少数 函数 适用 ) ， 我 们 逢 要 为 " 
播 "操作 定义 一 个 名 字 , 因此 (再 次 ) 使 用 了 apply。 

另外 , 接受 两 个 参数 的 版 本 如 下 : | 

b = apply(f,a,x); 1 blil=f(ali],x) for each i 


double scale(double d, double s) {returnd*s;}  . 
b = apply(scale,a,7); /blil = afij*7 for each i 


注意 ,“ 独 立 式 ”apply( ) 接 受 一 个 函数 作为 参数 ， 并 通过 其 参数 生成 运算 结果 ， 然后 利用 运算 结果 . 
初始 化 结果 矩阵 。 它 通常 不 修改 参数 中 的 Matrix 对 象 。 成 员 函 数 apply 的 不 同 之 处 在 于 , 会 修改 
原 矩 阵 中 元 素 。 例 如 : 


void scale_in_place(double& d, double s) { d *= s; } 
b.apply(scale_in_place,7D); /bl *= 7 foreachi 


Matrix 库 还 支持 传统 数值 计算 库 中 一 些 最 常用 的 函数 : 
Matrix<int> a3 = scale_and_add(a,8,a2); / fused multiply and add 
intr = dot_product(a3,a); / dot product 


函数 scale_and_add( ) 通常 称 为 融合 乘 - 加 运算 (fused multipljy-add，fma) ， 它 对 和 矩阵 中 每 个 元 素 i 
执行 result(i) =argl(i) *arg2 + arg3(i) 。 点 积 运算 dot_product 也 称 为 内 积 inner_product, 我 们 已 
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经 在 21. 5.3 节 中 对 这 种 运算 进行 了 介绍 ， 它 对 矩阵 中 每 个 元 素 执行 result += argl(i) * arg2 (i)， 
result 的 初 值 为 0。 

-一 维 数组 是 非常 常用 的 , 可 以 用 内 置 数 组 类 型 、vector 或 者 Matrix 来 实现 。 我 们 之 所 以 使 用 
Matrix 库 , 更 多 的 是 因为 需要 进行 矩阵 的 整体 运算 ,如 *=， 或 者 需要 使 用 多 维 矩 阵 。 

像 Matrix 库 函 数 这 类 工具 , 可 以 描述 为 “与 数学 描述 非常 接近 ”或 者 “ 令 程 序 员 不 必 纺 写 循环 
来 处 理 矩 阵 中 的 每 个 元 素 " 。 总 之 , 利用 这 些 函 数 编写 程序 , 代码 会 非常 简洁 , 而 且 不 容易 出 错 。 
Matrix 库 提 供 的 那些 操作 ， 如 拷贝 、 为 所 有 元 素 赋值 以 及 对 所 有 元 素 执行 相同 运算 等 ,都 使 我 们 
不 必 编 写 、 维护 循环 代码 (也 不 必 为 写 出 的 循环 是 否 确实 正确 而 烦恼) 。 

Matrix 提供 了 两 个 构造 函数 , 将 数据 从 内 置 数组 复制 到 Matrix 对 和 象 中 ,如 下 所 示 : 


void some_function(double* p, int n) 

4 
double vall] = {1.2, 2.3, 3.4, 4.5 }; 
Matrix<double> data(p,n); 
Matrix<double> constantsival); 
人 

} 


如 果 数 据 是 来 自 于 某 个 未 使 用 Matrix 库 的 程序 片段 ， 是 以 数组 或 vector 的 形式 提供 的 ， 这 两 个 构 
造 函 数 就 非常 有 用 了 。 

注意 , 编译 器 能 够 推断 出 已 经 初始 化 的 数组 的 规模 ,因此 上 面 这 段 程序 在 定义 constants 时 无 
须 给 出 元 素 个 数 。 另 一 方面 , 如 果 只 是 给 出 一 个 指针 的 话 , 编译 器 是 无 法 获得 元 素数 目的 , 因此 
定义 data 时 , 必须 给 出 指针 p 指向 的 数组 的 规模 (n) 。 
24. 5.3 二 维和 矩阵 

Matrix 库 的 设计 思想 是 : 不 同 维 数 的 矩阵 除了 维 数 之 外 , 其 他 方面 实际 上 是 非常 相似 的 ,， 因 
此 , 很 多 一 维 数组 的 概念 都 可 用 于 二 维 数组 ,如 下 所 示 : 


Matrix<int,2> a(3,4); 

int s = a.size(); // number of elements 

int di=a.dim1(); number of elements in a row 

int d2 = a.dim2(); // number of elements in a column 

int* p =a.data(); // extract data as a pointer to a C-style array 


可 以 看 到 , 我 们 能 够 获取 元 素 总 数 和 每 一 维 的 元 素数 目 , 可 以 获取 和 矩阵 在 内 存 中 存储 区 域 的 
指针 。 
当然 , 下 标 操作 仍然 是 必 不 可 少 的 ,如 下 所 示 : 


a(i,j); // (i,)th element (Fortran style), but range checked 
alil; // ith row (C style), range checked 
a[i[j; 1 (i,j)th element (C style) 


对 于 一 个 二 维 矩阵 ,下 标 操作 [获得 它 的 第 i 行 , 即 一 个 一 维 矩阵 。 这 意味 着 ,我 们 可 以 利用 这 
_ 特 性 从 二 维 矩 阵 中 提取 行 ,传递 给 那些 需要 一 维和 矩阵 甚至 内 置 数组 (af i]. data( ) ) 参 数 的 操作 
或 者 函数 。 注 意 ,a(i, j) 可 能 比 a[i] [j] 更 快 , 虽然 这 完全 由 编译 器 和 优化 器 所 决定 。 





| Matrix<int,2> a(3,4) 
| 一 一 一 aD] 
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二 维 矩 阵 也 支持 子 和 矩阵 操作 ,例如 : 


.Siicefi); 1 the rows from the ali] to the last 
a.sliceli,n); I the rows from the ali] to the ali+n—1] 


a.slice(0,2) 


Matrix<int,2> a(3,4) 





a[l2].slice(2) 


注意 , 一 个 二 维和 矩阵 的 子 和 矩阵 仍 是 二 维 矩 阵 ( 可 能 行 数 更 少 )。 
二 维和 矩阵 的 标量 操作 与 一 维和 矩阵 类 似 ， 这 二 折 作 并 不 关心 元 于 基 如 条 组 织 的 ， 只 是 简单 地 按 
元 聚 在 内 存 中 存放 的 次 序 对 它们 进行 处 理 而 已 ,如 下 所 示 


Matrix<int,2>a2=a; /copy initialization 


a= a2; I copy assignment 

a*=7; I/ scaling (and +=, —=, /=, etc.) 

a.apply(f); W ali,j)=f(a(i,))) for each element ali,j) 
a.apply(f,7); .ali,j)=f(a(i,j),7) for each element ali,j) 
b=apply(i,a); /I make a new Matrix with bt(i,j)==f(a(i,j) 
b=apply(f,a,7); ll make a new Matrix with bl(i,j)==f(a(i,j),7) 


行 交换 常常 是 很 有 用 的 ，Matrix 库 也 支持 这 种 操作 : 

a.swap_rows(1,2);  //swap rows a[1] <-> al[2] 
Matrix 并 没有 提供 swap_columns( ) 操 作 , 你 可 以 自己 实现 它 (参见 习题 11) 。 原 因 在 于 元 素 是 按 行 
主 次 序 存储 的 , 行 和 列 并 不 是 完全 对 称 的 。 这 种 不 对 称 性 也 体现 在 [i] 得 到 和 矩阵 的 一 行 , 但 Matrix 
并 未 提供 提取 列 的 运算 符 。 在 下 标 操 作 (i, j,k) 中, 第 一 个 下 标 i I 。 这 种 不 对 称 性 也 
反映 了 深层 次 的 数学 性 质 。 

在 现实 世界 中 , 有 很 多 事物 都 是 二 维 结构 的 ， 因此 显然 可 以 用 二 维和 矩阵 来 描述 ， 


enum Piece { none, pawn, knight, queen, king, bishop, rook }; . 
Matrix<Piece,2> board(8,8); /a chessboard 


const int white_start_row = 0; 
const int black_start_row = 7; 


piece init_pos[] = {rook, Inight bishop, queen, king, bishop, knight, rook); 
Matrix<Piece> start_row(init_pos); N initialize elements from init_pos 
Matrix<Piece> clear_row!(8) ; /8 elements of the default value 


对 clear_row 的 初始 化 利用 了 两 个 事实 :; none ==0; 元 录 轩 认 情况 下 被 初始 化 为 0。 对 于 start_ 


row 的 初始 化 , 我 们 可 能 希望 写成 这 样 : 


Natrix<Piece> start_row 
= {rook, knight, bishop, queen, king, bishop, knight， Wool); 


但 是 , 这 种 语法 直到 下 一 个 C++ 标准 被 批准 前 都 是 不 合法 的 , 因 此 我 们 必须 先 初始 化 一 个 数组 


(本 例 中 是 init_pos)， 然 后 再 用 它 来 初始 矩阵 对 象 。 有 了 上 述 定义 后 , 我 们 就 可 以 使 用 start_row 
和 clear_ row 了 : 


board[white_start_row] = start_row; I reset white pieces 
for (int i = 1; i<7; ++i) board[i] = clear_ row; ‘//clear middle of the board 
board[black_start row]= start row;  - I/ reset black pieces 


注意 , 当 我 们 使 用 Li 提取 一 行 时 , 我 们 得 到 一 个 左 值 (参见 4.3 节 ) ， 即 我 们 可 以 对 其 赋值 。 
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24. 5.4 和 矩阵 1/O 
Matrix 库 为 一 维和 二 维 矩阵 提供 了 非常 简单 的 VO 功能 : 


Matrix<double> a(4); 


cin >> a; 
cout << a; 


这 段 代 码 会 读 取 以 空白 符 间 隔 的 4 个 double 值 ， 以 花轿 号 起 止 ， 例如 : 
{1.23.45.67.8} 

输出 结 采 与 输入 内 容 很 相似 ,因此 你 所 瑟 入 的 数据 可 以 按 相同 的 方式 读 取 出 来 。 
二 维和 矩阵 的 VO 操作 简单 地 读 写 花 括 号 包含 起 来 的 一 维 矩 阵 序列 , 例如 : 


Matrix<int,2> m(2,2); 
cin >> m; 
cout << m; 


这 段 代码 读 取 类 似 下 面 所 示 的 内 容 : 


{ 
{12} 
{34} 
} 


输出 操作 与 输入 操作 非常 接近 。 
矩阵 的 << 和 >> 操作 符 主要 是 为 了 方便 编写 简单 程序 。 如 果 你 有 更 高 的 要 求 , 就 只 能 自己 
实现 了 。 另 外 ，<< 和 >> 的 定义 是 在 MatrixI0. h 中 (而 不 是 Matrix. h) , 因此 ,只 是 使 用 和 矩阵 的 基 
本 功能 (而 不 使 用 IO 功能 ) 的 话 ,就 不 需要 包含 此 头 文件 了 。 
24. 5. 5 三 维 给 阵 
三 维 ( 以 及 更 高 维 ) 短 阵 与 二 维 短 阵 相 比 , 除了 维 数 更 多 外 ， 其 他 方面 非常 相似 。 看 看 下 面 的 
代码 : 


Matrix<int,3> a10,20,30); 


a.size(); // number of elements 


adim1(); // number of elements in dimension 1 
a.dim2(); // number of elements in dimension 2 - 
a.dim3(); // number of elements in dimension 3 

int* p = a.data(); // extract data as a pointer to a C-style array 
ali,j,k); 1/ (i,j,k)th element (Fortran style), but range checked 
alil; // ith row (C style), range checked 

a[il[tjl{k]; 1/ (i,j,k)th element (C style) 

a.slice(i); // the elements from the ith to the last 
a,slice(i,j); // the elements from the ith to the jth 
Matrix<int,3> a2 = ay // copy initiajization 

a= 32; // copy assignment 

a *=7; // scaling (and +=, —=, /=, etc.) 

a.apply(f); / ali,j,k)=f(a(i,j,k)) for each element a(i,j,k) 
a.apply(f,7); /ati,j,k)=f(a(i,j,k),7) for each element ali,j,k) 
b=apply(f,a); // make a new Matrix with b(i,j,k)==f(a(i,j,k)) 
b=apply(f,a,7); // make a new Matrix with b(i,j,k)==f(a(i,}j,k),7) 


a.sSwap_rows(7,9);  //swap rows al7] <~> al9] 
如 果 你 理解 二 维 矩 阵 的 相关 概念 ,那么 也 就 能 理解 三 维和 矩阵 了 。 例 如 , 在 这 段 程序 中 , a 是 一 个 
三 维 矩阵 , 那么 a[ 让 就 是 一 个 二 维和 矩阵 (如 果 i 是 合法 下 标 ) ，a[ i ] [ 订 就 是 一 个 I 
是 合法 下 标 ) , 而 a[ i] [j][k] 就 是 一 个 整 型 元 素 (如 果 k 是 合法 下 标 ) 。 

我 们 倾向 于 把 现实 世界 看 成 三 维 的 , 因此 三 维和 矩阵 显然 可 以 用 于 现实 世界 的 建 模 (例如 , 使 
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用 第 卡 尔 坐 标 系 进行 物理 仿真 ) : 


intgrid_nx; /grid resolution; set at startup 

int grid_ny; 

int grid_nz; 

Matrix<double,3> cube(grid_nx, grid_ny, grid_nz); 


如 果 我 们 将 时 间 加 入 , 作为 第 四 维 , 那么 就 得 到 了 一 个 四 维 空间 , 可 用 一 个 四 维 Matrix 描述 , 依 此 类 推 。 
24.6 实例 : 求解 线性 方程 组 


对 于 一 个 数值 计算 程序 , 如 果 你 能 理解 代码 育 后 的 数学 含义 , 它 对 你 来 说 就 是 有 意义 的 , 否 
则 , 它 就 是 废话 一 堆 。 本 节 给 出 的 例子 是 求解 线性 方程 组 问题 ， 如 果 你 学 习 过 基本 的 线性 代数 知 
识 , 会 觉得 它 很 简单 ; 否则 , 你 就 把 它 看 做 求解 方案 到 代码 的 简单 转换 就 可 以 了 。 

求解 线性 方程 组 是 矩阵 的 一 个 相当 实际 也 非常 重要 的 应 用 , 其 目标 是 求解 下 面 这 种 形式 的 线 
性 方程 组 : Ql XI 十 … 十 CGI nn = b 


CIXI + + a, nx = 6, 
其 中 x, ，…, mo 表示 个 未 知 数 ， a1,，，…, 0,,。 和 b,,…,b, 是 给 定 的 常量 。 简 单 起 见 , 我们 假定 未 
知 数 和 常量 都 是 浮 点 值 。 问 题 的 目标 是 找到 能 同时 满足 个 方程 的 未 知 数值 。 方 程 组 可 以 更 简洁 
地 表示 为 矩阵 和 向 量 乘法 的 形式 : 
4x =b 
其 中 , 4 是 一 个 nxn 的 系数 方 阵 : 


向 量 x 和 2 分别 是 未 知 数 和 常量 向 量 : 











和 
这 个 系统 可 能 有 0 个 、1 个 或 者 无 穷 多 个 解 , 这 取决 于 系数 矩阵 4 和 向 量 b。 求 解 线 性 系统 的 方法 
有 很 多 , 本 节 使 用 一 种 经 典 的 方法 一 一 高 斯 消去 法 (参见 Freeman 和 Phillips 的 《Parallel Numerical 
Algorithms》; Stewart 的 《Matrix Algorithms( 第 一 卷 )》 以 及 Wood 的 《Introduction to Numerical Analy- 
sis》) 。 首 先 , 我 们 对 4 和 5 进行 变换 , 使 得 4 变 为 一 个 上 三 角 和 矩阵 。 所 谓 上 三 角 和 矩阵 ， 就 是 对 角 
线 之 下 的 所 有 元 素 均 为 0。 换 句 话说 ,系统 转换 为 如 下 形式 : 


人 二 
…， | 
0 0 CQ 
实现 这 个 目标 是 很 容易 的 。 为 了 使 a(i, j) 变 为 0, 我 们 先 将 它 乘 以 一 个 常量 , 使 它 等 于 第 j 列 上 
的 另 一 个 元 素 , 比如 说 等 于 a(k, j) 。 然 后 , 用 第 i 个 方程 减 去 第 个 方程 , a(i, 力 即 变 为 0, 矩阵 
第 i 行 其 他 元 素 的 值 也 相应 发 生 改 变 。 : 
如 果 这 样 一 个 变换 最 终 使 得 对 角 线 上 所 有 元 素 都 非 0, 方程 组 就 有 唯一 解 , 此 解 可 以 通过 “ 回 
代 ”( back substitution) 求 得 。 其 过 程 是 这 样 的 , 首先 通过 最 后 一 个 方程 求 得 x,: 


Cn,nXn 二 2， 


1 


一 一 














多 
n 
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显然 , x, =b,/a,,,。 随 后 , 将 第 n 行 从 系统 中 删除 , 继续 求解 x,.,, 依次 类 推 , 直至 求解 出 x 的 
值 。 在 每 个 步骤 中 , 都 是 除 以 c,:， 因 此 对 角 线 上 的 元 素 必 须 非 0。 否 则 , 回 代 方 法 就 失败 了 , 意 
味 着 方程 组 有 0 个 或 无 穷 多 个 解 。 


24. 6.1 经典 的 高 斯 消去 法 
我 们 现在 来 看 看 如 何 用 C++ 程序 来 表示 上 述 计算 方法 。 首 先 ， 定义 两 个 要 使 用 的 具体 Matrix 
类 型 ,以 简化 程序 ; 


typedef Numeric_lib:: Matrix<double, 2> Matrix; 
typedef Numeric_lib: :Matrix<double, 1> Vector; 


接 下 来 我 们 将 高 斯 消去 法 计算 过 程 描述 如 下 : 
Vector classical _ gaussian_elimination(Matrix A, Vector b) 
{ a 
classical_elimination(A, b); 
return back_substitution(A, b); 
} 


即 先 为 两 个 输入 4 和 2 创建 拷贝 (使 用 传 值 参数 ) , 然后 调用 一 个 函数 求解 方程 组 , 最 后 调用 回 代 
函数 计算 结果 并 将 结果 返回 。 关 键 之 处 在 于 , 我 们 分 解 问题 的 方式 和 符号 表示 都 完全 来 自 于 原始 
的 数学 描述 。 下 面 所 要 做 的 就 是 实现 classical _elimination( ) 和 back Saben linonl ) 了 ， 解决 方案 同 
样 完全 来 自 于 数学 教科 书 : 


void classical elimination(Matrix& A, Vector& b) 
{ 


const Index n = A.dim1(); 


// traverse from 1st column to the next-to-last 
/filling zeros into all elements under the diagonaj: 
for (indexj = 0; j<n-1; ++j) { 

const double pivot = A(j, )); 

if (pivot == 0) throw Elim_failure()); 


/fill zeros into each element under the diagonai of the ith row: 
for (Index i = j+1; i<n; ++i) { 

const doubie mult = A(i, j) / pivot; 

A 站 .slice() = scale_and_add(A[j]l.slice()), ~-mult, A[i].slice())); 
bi) -= muit* b(j); /make the corresponding change to b 


} 
“pivot” 表 示 当前 行 位 于 对 角 线 上 的 元 素 ， 它 必须 非 0, 因为 需要 用 它 作 为 除数 ; 如 果 它 为 0, 我 们 
将 放弃 计算 , 抛 出 一 个 异常 : 
Vector back_substitution(const Matrix& A, const Vector& b) 
{ 


const Index n = A.dim1(); 
Vector x(n); 


for (Indexi=n -1;i>=0;--i)t{ 
double s = bt)~-dot -produ A deel)x slice(i+D)); 


if (double m = Ai i)) 
xD) =s/m; 
eise 
throw Back_subst_failure(i); . 
} . 


return x; 
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24. 6.2 选取 主 元 | 

pivot 为 0 的 问题 是 可 以 避免 的 , 我 们 可 以 对 行进 行 排序 , 从 而 将 0 和 较 小 的 值 从 对 角 线 上 移 
开 , 这 样 就 得 到 了 一 个 更 重 棒 的 方案 “更 鲁 棒 ” 是 指 对 于 舍 人 误差 更 不 敏感 。 但 是 ， 随 着 我 们 将 
0 置 于 对 角 线 之 下 ,元 素 值 也 会 发 生 改 变 。 因 此 , 为 了 降低 误差 的 影响 , 我 们 必须 进行 重 排序 ， 以 
将 较 小 的 值 从 对 角 线 上 移 开 ( 即 不 能 重 排 矩阵 后 就 直接 使 用 经 典 算法 ): 

void elim_with_partial_pivot(Matrix& A, Vectora& b) 

{ 


const Index n =A.dim10); 


for (Indexj =0; j<n; ++)) { 
Index pivot_row =j; 


/ jook for a suitable pivot: 
for (Index k=j+1; k<n; ++k) 
if (abs(A(k, j)) > abs(A(pivot_row, j))) pivot_row = j; 


// swap the rows if we found a better pivot: 
if (pivot_row !=)) { 

A.swap_rows!(j, pivot_row); 

std: :swap(b(j), b(pivot_row)); 


// elimination: 
for (Indexi=j+1;i<n; ++i) { 
const double pivot = A(, j); 
if (pivot==0) error("can't solve: pivot==0"); 
const double mult = A(i, j)/pivot; 
ArD.slice() = scale_and_add(Afj].slice()), ~mult, Afi].slice())); 
b(i) -= mult * bj); 


} 
} 


在 这 里 我 们 使 用 了 swap_rows( ) 和 scale_and_multiply( ) ,这样 程 序 更 符合 习惯 ， 我 们 也 不 必 显 式 
编写 循环 代码 了 。 


24. 6.3 测试 
显然 ,我 们 下 面 应 该 对 代码 进行 测试 。 幸 运 的 是 , 我 们 有 一 下 如 下 所 示 


void solve_random_system(Index n) 

{ 
Matrix A= random_matrix(n);  //see §24.7 
Vector b = random_vector(n); . 


cout<<"A="<<A << endl; 
cout << "hb =" <<b << endl; 


try { 
Vector x = classical_gaussian_elimination(A, b); 
cout << "classical elim solution is x = " <<x << endl; 
Vectorv=A*x; . | 
cout<<"A*x=" <<yv<< endl; 

) 

catch(const exception& e) { 
cerr << e.what() << std: :endl; 

} 


540 锚 四 部 分 后 笼 琅 野 


程序 在 三 种 情况 下 会 进入 catch 子 句 : 

e 代码 中 有 bug( 但 是 , 作为 乐观 主义 者 , 我 们 不 认为 现在 的 代码 中 有 bug) 。 

。 输入 内 容 是 classical_elimination 出 现 错误 (我 们 本 应 该 用 elim_with_partial_pivot ) 。 

e 舍 人 误差 导致 问题 。 
但 是 , 这 种 测试 方法 不 像 我 们 期 望 的 那样 接近 实际 ， 因为 真正 的 随机 甜 阵 不 太 可 能 导致 classical_ 
elimination 出 现 错 误 。 

为 了 测试 程序 , 我 们 输出 A * x, 其 值 应 该 与 b 相当 。 但 考虑 到 存在 含 人 误差 若 其 值 与 b 足够 接 
近 就 应 该 认为 结果 正确 , 这 也 是 为 什么 测试 程序 中 没有 采用 下 面 语句 来 判断 结果 是 否 正确 的 原因 


if(A*x!=b) error("substitution failed"); 
在 计算 机 中 , 浮 点 数 只 是 实数 的 近似 , 因此 我 们 必须 接受 近似 的 计算 结果 。 一 般 来 说 ， 应 该 避免 
使 用 == 和 ! = 来 判断 绪 果 是 否 正 确 。 

Matrix 库 并 没有 定义 矩阵 与 向 量 的 匀 法 运算 ,因此 我 们 为 测试 程序 定义 这 个 运算 ， 


Vector operator*(const Matrix& m, const Vector& u) 
{ 
const index n = m.dim1(); 
Vector v(n); 
for (Index i = 0; i < n; ++i) v(i) = dot_product(mli], u); 
return v; 


} 
我 们 再 次 看 到 , 一 个 简单 Matrix 操作 能 帮助 我 们 完成 大 部 分 工作 。Matrix 的 输出 操作 是 在 Ma- 
trixIO. h 中 定义 的 , 我 们 在 24. 5. 3 节 中 已 经 对 此 进行 了 介绍 。random_matrix( ) 和 random_vector( ) 
是 随机 数 的 简单 应 用 (参见 24.7 节 ), 这 两 个 函数 的 实现 留 作 练习 。 Index 是 索引 类 型 ， 它 是 用 ty- 
pedef 定义 的 (参见 附录 A. 15) 。 我 们 使 用 using 将 Index 引入 当 前 作用 域 : 


using Numeric_ lib: :Index; 


24.7 随机 数 


”如 果 你 要 求人 们 说 出 一 个 随机 数 , 大 多 数 人 会 回答 7 或 17, 这 表明 人 们 认为 这 两 个 数 是 “最 随机 
的 ”"。 几 平 不 会 有 人 回答 0, 因为 0 被 视 为 一 个 非常 完美 的 数 , 没 人 认为 它 是 “随机 的 ”， 因 此 被 看 做 
“最 不 随机 ”的 数 。 从 数学 的 观点 来 看 , 这 绝对 是 错误 的 。 随 机 数 并 不 是 指 单个 的 数 。 我们 常用 的 、 
常 说 的 随机 数 , 是 指 一 个 服从 某 种 分 布 的 序列 , 其 特点 是 你 无 法 很 容易 地 从 序列 前 一 部 分 的 内 容 预 
测 出 下 一 个 数 是 什么 。 随 机 数 的 应 用 领域 非常 广 , 包括 程序 测试 (用 于 生成 大 量 测试 用 例 )、 游 戏 
(确保 游戏 的 下 一 步 与 之 前 的 步 又 不 同 ) 以 及 仿真 ( 令 仿真 对 象 在 参数 限定 范围 内 “随机 地 ”运行 ) 等 。 

随机 数 既是 一 个 实用 工具 , 也 是 一 个 数学 问题 , 它 高 度 复杂 , 这 与 它 在 现实 世界 中 的 重要 性 
是 相 匹配 的 。 在 本 节 中 , 我 们 只 讨论 随机 数 的 最 基本 的 内 容 , 这 些 内 容 可 用 于 简单 的 测试 和 仿 
真 。 在 < cstdlib > 中 , 标准 库 提 供 了 如 下 特性 : 


int rand(); // returns values in the range [0:RAND_MAXj 
RAND_MAX // the iargest value that rand() can produce 
void srand(unsigned int); // seed the random number Benerator 


反复 调用 rand( ) 就 可 以 生成 一 个 整 型 伪 随 机 数 序列 ， 此 序列 服从 [0 : RAND ) MAX] 内 的 均匀 分 布 。 
我 们 称 这 个 序列 是 “ 伪 随 机 的 ”， 因 为 它 是 由 一 个 数学 公式 计算 出 来 的 , 因此 经 过 一 段 间隔 后 就 会 
重复 ( 即 它 是 可 预测 的 ,并 非 完全 随机 的 ) 。 特 别 是 ,如 果 我 们 在 一 个 程序 中 反复 调用 rand( ), 那 
么 每 次 执行 这 个 程序 都 会 得 到 相同 的 伪 随 机 数 序列 。 这 对 于 程序 调试 是 非常 有 用 的 特性 。 如 果 
我 们 希望 每 次 执行 程序 都 得 到 不 同 的 序列 , 可 以 在 程序 开头 用 不 同 的 参数 调用 srand( ) 。 调 用 
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srand( ) 的 参数 不 同 , rand( ) 生 成 的 随机 数 序列 就 不 同 。 
例如 ,考虑 24. 6. 3 节 中 用 到 的 random_vector( ) 。 调 用 random_vectorf n ) 就 会 生成 一 个 Matrix 
< double, 1 > 类 型 的 矩阵 对 象 , 它 包含 n 个 元 素 , 元 素 值 都 是 [0 :mn] 之 间 的 随机 数 ; 


Vector random_vector(Index nm) 


{ 
Vector v(n); 


for (Index i = 0; i < n; ++i) 
vi=10°*n "rand() /RAND MAX; 


return Vs: 
, 
注意 , 使 用 1.0 是 为 了 保证 运算 都 是 浮 点 运算 。 如 果 除 以 RAND_MAX 的 运算 是 整数 除法 , 那么 
得 到 的 结果 永远 为 0, 这 显然 不 是 我 们 所 期 望 的 。 

得 到 指定 区 间 , 如 [0 : max) 内 的 一 个 整数 , 是 很 困难 的 。 很 多 人 开始 时 都 会 尝试 这 样 做 : 

int val = rand(}%max; 
在 以 往 , 这 不 是 一 个 好 方法 , 因为 这 个 计算 实际 上 是 取 随 机 数 低 位 的 值 , 而 很 多 传统 的 随机 数 发 
生 器 所 生成 的 随机 数 , 在 低位 上 并 不 是 完全 随机 的 。 对 于 当前 的 大 多 数 随 机 数 发 生 器 , 这 个 问题 
并 不 那么 严重 了 , 但 考虑 到 代码 的 可 移植 性 , 最 好 将 随机 数 的 计算 “隐藏 "在 一 个 函数 中 ,例如 : 


int rand int(int max) { return rand()%max; } 


int rand int(int min, int max) { return rand int(max—min)+min; } 
采用 这 种 方式 ， 当 你 发 现 系统 中 rand( ) 的 实现 很 差 , 使 得 rand int( ) 的 效果 不 佳 时 , 可 以 按 需 要 修 
改 rand int( ) 的 实现 , 而 不 必修 改 程序 的 其 他 部 分 。 如 果 你 是 在 开发 一 个 工业 品质 的 软件 , 或 者 需 
要 伪 随 机 数 序列 服从 非 均 匀 分 布 时 , 你 可 以 选择 更 高 质量 的 随机 数 库 , 这 类 库 有 很 多 ， 比 如 
Boost :: random 就 是 其 中 之 一 。 请 完成 习题 10, 你 会 对 随机 数 发 生 器 的 质量 有 所 体会 。 


24.8 标准 数学 函数 
标准 库 中 也 提供 了 常用 的 标准 数学 函数 (cos 、sin 、log 等 ) , 这 些 函 数 的 定义 都 在 < cmath > 中 : 





标准 数学 函数 

abs( x) 绝对 值 

ceil(x) 向 上 取 整 一 一 > =x 的 最 小 整数 
floor( x) 向 下 取 整 < =x 的 最 大 整数 
sqrt( x) 平方 根 , x 必须 是 非 负 数 

C0S{( X) 余弦 

sin(x) 正 台 

tan( x) 正切 

acos( x) 反 余 弦 ,， 结果 取 为 非 负数 
asin(x) 反正 台 , 结果 取 最 接近 0 的 值 
atan( x) 反正 切 

sinh{ x) 双 曲 正弦 

cosh( x) 双 曲 余弦 

tanh( xy) 双 曲 正切 

exp( x) e 的 指数 


log( x) 
logl0O(x) 


目 然 对 数 , 即 以 e 为 底 , x 必须 是 正 数 
以 10 为 底 的 对 数 
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标准 数学 函数 的 参数 可 以 是 如 下 类 型 : float、double、long double 和 complex (参见 24.9 节 ) 。 如 果 
你 需要 做 浮 点 计算 , 会 发 现 这 些 函 数 非常 有 用 。 如 采 你 需要 了 解 更 多 细 方 ， se, 标 
准 库 的 联机 文档 就 可 以 作为 一 个 很 好 的 入 门 材料 。 

如 果 一 个 标准 数学 函数 无 法 计算 出 有 效 结 果 , 它 会 设置 变量 erno。 例 如 : 


errno = 0; 
double s2 = sqrt(—1); 
if (errno) cerr << "something went wrong with something somewhere"; 
if (errno == EDOM) / domain error a 

cerr << "sqrt() not defined for negative argument"; 
pow(very_large,2); /not a good idea 
if (errno==ERANGE)  //range error 

cerr << "pow(" << very_large << ",2) too large for a double"; 


如 果 你 要 做 一 些 重要 的 计算 , 在 计算 完成 之 后 应 该 检查 ermo 的 值 , 确保 它 仍 为 0。 如 果 ermo 变 
为 非 0 一定 是 出 现 错误 了 。 请 查阅 手册 或 者 联机 文档 , 检查 哪些 数学 函数 可 以 设置 ermo, 以 及 
ermo 的 不 同 的 值 分 别 代表 什么 错误 类 型 。 

如 上 例 所 示 , ,ermo 非 0 仅仅 表示 “什么 地 方 发 生 错误 了 ”, 获得 具体 错误 类 型 和 错误 位 置 还 要 
正确 检测 ermo 的 值 。 标 准 库 之 外 的 函数 在 发 生 错误 时 也 可 能 设置 ermo 的 值 , 因此 在 检查 ermo 
值 的 时 候 一 定 要 小 心 ,以 确保 找到 正确 的 错误 位 置 。 正 确 的 方法 是 在 调用 标准 库 函 数 前 确认 
ermo ==0, 在 困 数 返回 后 立刻 检查 ermo 的 值 ， 这 样 就 可 以 保证 ermo 的 值 反 映 了 了 消 数 的 错误 类 
型 。 就 像 上 例 中 那样 , 我 们 可 以 检测 ermo 是 否 等 于 EDOM 和 ERANGE 来 判断 错误 类 型 。 其 中 
EDOM 表 示 定 义 域 错 误 ( 即 参数 错误 ) , 而 ERANGE 表示 值 域 错误 ( 即 计算 结果 错误 ) 。 

基于 ermo 的 错误 处 理 技术 已 经 有 很 长 历史 了 , 它 的 产生 可 以 追溯 到 第 一 个 C 语言 数学 函数 
出 现 的 年 代 (1975 年 )。 


24.9 复数 


复数 在 科学 和 工程 计算 中 广泛 使 用 。 我 们 假定 你 已 经 了 解 了 相关 的 数学 知识 , 因此 本 节 只 介 
绍 如 何 用 ISO C++ 标准 库 来 表达 复数 运算 。 复数 及 其 标准 数学 函数 的 定义 都 在 < complex > 中 : 


_ template<class Scalar> class complex { 
/a complex is a pair of scalar values, basically a coordinate pair 
Scalar re, im; 

public: 
complex(const Scalar & r, const Scalar & i) :re(r), im(i) { } 
complex(const Scalar & r) :re(r),im(Scalar ()) { } 
complex() :re(Scalar ()), im(Scalar () {} 


Scalar real() { return re; } / real part 
Scalar imag0 {returnim;} /imaginary part 


/ operators: = += -= *= /= 
}; 
标准 库 中 的 complex 支持 标量 类 型 float、double 和 long double 构成 的 复数 。 除 了 complex 的 成 员 以 
及 标准 数学 函数 (参见 24.8 节 ) 之 外 , < complex > 还 提供 了 大 量 有 用 的 运算 : 


复数 运算 
zl + 22 加 法 
zl -2 减法  - 


ZL * 72. . . Ee . 乘法 .. 
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【《 续 ) 
复数 运算 
z1/z22 除法 
zl ==22 相等 
zl!=z2 不 等 
norm( z) abs(z) 的 平方 
conj(z) 共 轿 : 如 果 z 是 |re, imj , 则 conj(z) 为 [re, -iml : 
polar( x, y) 用 给 定 的 极 坐标 (rho, theta) 构造 一 个 复数 
real( z) 实 部 
imag( 2) 虚 部 
abs(z) 模 , 也 称 为 tho 
arg(z) 有 加 角 , 也 称 为 heta 
本 ”输出 : 
in >>z 输入 


注意 ，complex 未 提供 < 或 % 。 
complex <T > 的 使 用 与 double 这 样 的 内 置 类 型 完全 一 样 。 例 如 : 


typedef complex<double> dcmplx;  //sometimes complex<double> 
// gets verbose 
void f(dcmplx z, vector<dcmphxc>& vc) 
{ 
dcmplx z2 = pow!(z,2); 
dcmplx z3 = Z2*9.3+vc[3]; 
i sum = accumulate(vc. begin(), vc.end(), dcmplx()); 
Ha 
} 


请 记 住 ， 并 不 是 对 所 有 的 int 和 double 运算 ， sole 都 定义 了 相应 的 复数 运算 。 例如 ， 


if (zZ2<z3) // error: there js no < for complex numbers 


注意 ， C++ 标准 库 中 复数 的 描述 ( 布局 ) 3 C 和 Fortran 中 的 对 应 实 类 型 是 兼容 的 。 
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人 简单 练习 


l, 
2 


打印 char、short、int、long、float、double、int” 和 double” 的 宽度 (利用 sizeof, 而 不 是 <limits > ) 。 
用 sizeof 打印 Matrix <int > a(10)、Matrix <int > b(100)、 Matrix < double > c(10)、 Matrix <int, 2 > d(10, 
10)、Matrix <int, 3 > e(10, 10, 10) 的 宽度 。 


. 打印 第 2 题 中 每 个 矩阵 的 元 素数 目 。 
. 编写 程序 , 从 cin 读 和 int 型 整数 , 输出 每 个 整数 的 平方 根 sqrt( ) , 或 者 no square root”( 检查 sqrt( ) 的 返 


回 值 , 判断 运算 是 否 非法 )。 


. 从 输入 读 取 10 个 浮 点 值 , 将 它们 存 人 一 个 Matrix < double > 对 象 。Matrix 没有 定义 push_back( ) 操作 ， 所 


以 要 小 心 处 理 错 误 的 double 值 的 情况 。 最 后 输出 矩阵 。 


. 计算 [0, n) * [0, m) 乘 法 表 , 将 它 保 存在 一 个 二 维和 矩阵 中 。 n 和 m 的 值 从 cin 读 入。 最 后 ， 以 漂亮 的 格式 


输出 乘法 表 ( 假 定 m 足够 小 , 屏幕 的 一 行 能 容纳 乘法 表 的 一 行 ) 。 


. 从 cin 读 和 人 10 个 复数 complex < double > (cin 支持 complex 的 >> 操作 ) , 将 它们 保存 在 一 个 夭 阵 中 。 计算 


并 输出 这 10 个 复数 的 和 。 
8. 读 人 6 个 int 型 整数 ， 存 人 一 个 矩阵 对 象 Matrix < int，2 > Im(2， 3) 中 ， 并 输出 这 些 整数 。 


- 思考 题 


D oo oA 


. 哪些 人 使 用 数值 计算 ? 

. 什么 是 精度 ? 

. 什么 是 溢出 ? 

. 一 般 来 说 double 的 宽度 是 多 少 ? int 的 宽度 是 多 少 ? 
你 如 何 检 测 溢出 ? 

. 在 哪里 能 找到 数值 限制 ? 如 最 大 的 int 值 是 多 大 ? 
.什么 是 数组 ? 什么 是 行 , 什 么 是 列 ? 

. 什么 是 C 风格 的 多 维 数组 ? 


.程序 设计 语言 中 支持 矩阵 运算 的 部 分 (如 和 矩阵 库 ) 必 备 的 特性 是 什么 ? 


10. 什么 是 矩阵 的 维 ? 
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一 个 矩阵 可 以 有 多 少 维 (从 理论 上 、 数学 上 看 )? 


. 什么 是 子 和 矩阵 ? 

. 什么 是 “广播 "运算 ? 请 举 出 一 些 例 子 。 

，Fortran 风格 的 下 标 和 C 风格 的 下 标 有 什么 区 别 ? 

. 如何 对 和 矩阵 中 每 个 元 素 都 进行 一 个 相同 的 操作 ? 请 举例 。 
. 什么 是 融合 运算 ? : 
.请 定义 点 积 运算 。 

. 什么 是 线性 代数 ? 

. 什么 高 斯 消去 法 ? 


20. (线性 代数 中 的 、“ 现 实生 活 中 ”的 ) 主 元 (pivot) 是 指 什么 ? 
21. 什么 令 一 个 数 随机 ? 
22. 什么 是 均匀 分 布 ? 
23， 从 哪里 可 以 找到 标准 数学 函数 ”它们 支持 哪些 类 型 的 参数 ? 
24. 复数 的 虚 部 是 什么 ? 
-1 的 平方 根 是 什么 ? 
人 不 
数组 Fortran 标量 的 C 融合 运算 大 小 
列 虚 部 sizeof 复数 Matrix 子 和 矩阵 
维 多 维 下 标 点 积 随机 数 均匀 分 布 
逐 元 素 运 算 实数 errmo 行 


已》 习题 


1. 


10. 


1 1. 


12. 


a. apply(f) 和 apply(f, a) 所 使 用 的 函数 参数 f 是 不 同 的 。 为 两 个 apply( ) 分 别 编 写 一 个 double( ) 函数 , 完 
成 的 功能 都 是 将 数组 | 1 2 3 4 5 jj 中 元 素 值 加 倍 。 定 义 一 个 统一 的 double ( ) 函数 ,， 既 能 用 
于 a. apply(double) ， 又 能 用 于 apply( double, a) 。 解 释 一 下 , 为 什么 采取 这 种 方式 编写 apply( ) 所 使 用 的 
隔 数 并 不 是 一 种 好 的 方法 ? 


. 重 做 习题 1, 但 实现 的 是 函数 对 象 而 不 是 函数 。 提 示 : Matrix. h 中 有 示例 。 
. 本 题 不 适合 初学 者 (利用 本 书 中 介绍 的 工具 无 法 完成 此 题 ) : 编写 一 个 apply(f，a) ,对 于 函数 参数 f，apply 


可 以 接受 的 类 型 有 void (T&) 、T (const T&) 以 及 对 应 的 函数 对 象 。 提 示 : 参考 Boost :: bind。 


. 编译 、 测试 高 斯 消去 法 程序 。 
. 用 A==|1101} 和 1 0} 和 b== {5 6 测试 高 斯 消去 法 程序 , 观察 错误 。 然 后 测试 elim_with_partial_pivot( ) 。 
. 将 高 斯 消去 法 程序 中 的 向 量 运 算 dot_product( ) 和 scale_and_add( ) 替换 为 循环 。 测 试 这 个 程序 , 并 添加 必 


要 的 注释 , 提高 代码 的 可 读 性 。 


. 重 写 高 斯 消去 法 程序 , 不 使 用 Matrix 库 ， 只 使 用 内 置 数 组 或 vector。 
.动态 演示 高 斯 消去 法 。 
. 重 写 非 成 员 函 数 apply( ) ,返回 所 应 用 函数 返回 类 型 的 数组 ， 即 如 果 了 ff 的 返回 类 型 为 R, 则 apply(f, a) 返 


回 一 个 Matrix < R > 对象。 注意 : 本 题 的 求解 要 用 到 本 书 未 涉及 的 一 些 模 板 方面 的 知识 。 
你 所 使 用 的 rand( ) 到 底 有 多 随机 ? 编写 程序 , 读 人 两 个 整数 n 和 d, 调用 ranqint(n) d 次, 记录 生成 的 随 
机 数 。 输 出 随机 数 的 分 布 , 即 [0: na) 间 每 个 值 出 现 的 次 数 , 观察 计数 的 相似 程度 。 测 试 较 小 的 n 和 d， 
观察 生成 较 少 的 随机 数 是 否 会 导致 明显 的 分 布 不 均 。 
编写 与 24. $. 3 节 中 swap_rows( ) 对 应 的 swap_columns( ) 。 显 然 , 你 必须 阅读 、 理 解 Matrix 库 中 的 一 些 代 
码 , 才能 完成 这 个 函数 的 设计 。 不 必 太 在 意 效 率 : 让 ape ) 与 swap_rows( ) 一 样 快 是 不 可 能 的 。 
实现 
Matrix < double > operator * (Matrix < double, 2 > &, Matrix < double > &); 

和 
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Matrix < double, N > operator + (Matrix < double, N > &, Matrix < double, N > &); 
如 果 需 要 , 请 在 相关 教科 书 中 寻找 相关 的 数学 定义 。 


二 》 附 言 
如 果 你 不 太 喜 欢 数学 , 那么 你 可 能 也 不 太 喜 欢 这 一 章 ， 你 可 能 应 该 选择 一 些 不 需要 本 章 知识 的 工作 。 
男 一 方面 , 如果 你 喜欢 数学 , 我 们 希望 你 能 仔细 体会 基本 的 数学 概念 和 代码 实现 之 间 是 如 此 接近 。 


第 25 章 ”嵌入 式 系 统 程序 设计 


“不 安全 ' 就 意味 着 “有 人 可 能 付出 生命 代价 ”。” 


本 章 介绍 工人 式 程序 设计 ,， 即 介绍 为 "小 设备 "编写 程序 的 基本 知识 ， 而 不 是 为 那些 配置 有 屏 
幕 和 键盘 的 传统 计算 机 编写 程序 。 我 们 重 氮 讨论 编写 "更 接近 硬件 的 程序 所 需 的 基本 原理 、 程 序 
设计 技术 、 语言 特性 和 编码 规范 。 语 言 方 面 主要 包括 资源 管理 、 内 存 管理 、 指 针 和 数组 的 使 用 以 
及 位 运算 等 问题 , 重点 是 低层 特性 的 使 用 和 圭 代 方法 。 我 们 不 会 介绍 特殊 的 机 吾 染 构 或 者 二 接 访 
问 硬件 设备 的 方法 , 这 些 应 该 是 专门 文档 和 手册 介绍 的 内 容 。 本 章 最 后 会 给 出 一 个 加 密 / 解 密 算 


一 一 一 生生 遂 


法 的 实现 的 例子 。 


25. ] 


实际 上 , 世界 上 大 多 数 的 计算 机 系统 ,都 不 太 像 "计算 机 "。 它 们 可 能 是 一 个 大 型 系统 的 组 成 


其 入 式 系 统 


部 分 , 或 者 仅仅 是 一 个 “小 设备 ”。 例 如 : 


汽车 : 一 台新 式 汽车 可 能 配 有 数 十 台 计 算 机 ， 用 于 控制 燃油 喷射 、 监 控 引擎 性 能 、 调节 收 


音 机 、 控制 刹车 、 监 控 轮 胎 充 气 不 足 的 情况 、 控 制 风挡 雨刷 等 。 
电话 : 一 部 新 式 手机 内 至 少 有 两 台 计 算 机 , 通常 其 中 一 台 专 门 用 于 信号 处 理 。 


飞机 : 一 架 现代 飞机 内 也 有 多 台 计 算 机 , 完成 从 运行 乘客 娱乐 系统 到 摆动 辟 端 优化 飞行 特 


性 等 各 种 各 样 的 任务 。 


照相 机 : 现在 已 经 有 配置 5 个 以 上 处 理 器 的 照相 机 了 , 甚至 每 个 镜头 都 由 独立 的 处 理 器 来 


控制 。 

信用 卡 (“ 智 能 卡 "的 一 种 ) 。 

医疗 设备 监测 器 和 控制 器 (例如 CAT 扫描 仪 )。 

电梯 (升降 机 ) 。 

PDA( Personal Digital Assistant, 个 人 数字 助理 )。 

打印 机 控制 器 。 

音响 系统 。 

MP3 播放 器 。 

厨房 用 具 ( 如 电饭煲 和 烤 面 包机 ) 。 

电话 交换 设备 (通常 包含 数 千 个 专用 计算 机 ) 。 

水 又 控制 器 (抽水 或 者 抽 油 等 ) 。 

焊接 机 器 人 : 在 人 类 焊工 无 法 进 人 的 狭小 或 者 危险 的 环境 中 完成 焊接 任务 。 
风力 涡轮 机 :, 一 些 风力 涡轮 机 高 达 70 米 (210 英尺 ) , 能 产生 数 兆 瓦 电能 。 
防潮 闹 控 制 器 。 

装配 线 质量 监控 器 。 


e 条 码 阅读 器 。 
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。 汽车 组 装机 器 人 。 

。 离心 机 控制 器 (很 多 医学 分 析 过 程 中 要 用 到 )。 

。 磁盘 驱动 器 控制 器 。 
这 些 计算 机 都 是 大 型 系统 的 一 部 分 。 这 些 “ 大 型 系统 "通常 看 起 来 不 像 一 台 计 算 机 , 我 们 通常 也 不 
把 它们 看 做 计算 机 。 当 看 到 一 辆 小 轿车 沿 着 大 街 驶 来 , 我 们 绝 不 会 说 :“ 快 看 ! 那儿 有 一 个 分 布 
式 计算 机 系统 1” 是 的 , 小 轿车 也 是 一 个 分 布 式 计算 机 系统 , 但 其 运行 已 经 与 机 械 系 统 、 电 子 系统 
以 及 电气 系统 非常 紧密 地 结合 在 一 起 了 , 我 们 实际 上 无 法 孤立 地 考察 计算 机 系统 。 它 在 计算 上 
(时 间 上 和 空间 上 ) 的 限制 和 程序 正确 性 的 定义 上 都 已 经 不 能 与 整个 系统 分 开 了 。 通 常 , 一 台 艇 人 
式 计算 机 控制 某 个 物理 设备 , 计算 机 的 正确 行为 被 定义 为 物理 设备 的 正常 操作 。 我 们 来 看 一 台大 
型 的 船用 柴油 机 ,如 下 图 所 示 : 





: 汪 : 关 站 这 
tT 


注意 位 于 5 号 汽 生前 端的 人 。 这 是 一 台 巨 大 的 引擎 , 这 种 引擎 为 大 型 船舶 提供 动力 。 如 果 一 台 这 
样 的 引擎 发 生 故 障 , 你 就 会 在 早报 的 头 版 上 看 到 相关 的 新 闻 。 在 这 个 引擎 上 , 每 个 汽缸 前 端 都 有 
一 个 由 三 台 计 算 机 组 成 的 汽缸 控制 系统 。 每 个 汽 征 控 制 系统 都 通过 两 个 独立 的 网 络 系统 和 引擎 
控制 系统 (由 另外 三 台 计 算 机 组 成 ) 相 连 。 引 擎 控制 系统 又 连接 到 控制 室 , 在 那里 , 机 械 工程 师 可 
以 通过 一 个 专门 的 GUI 系统 与 引擎 控制 系统 交互 。 在 航线 中 心 , 可 以 使 用 无 线 电 系统 (通过 卫 
星 ) 对 整个 系统 进行 远程 监控 。 更 多 的 实例 可 参考 第 1 章 。 
那么 ， 从 一 个 程序 员 的 观点 来 看 , 运行 在 这 样 一 台 引 擎 内 的 计算 机 之 上 的 程序 有 什么 特殊 之 
处 呢 ? 更 一 般 地 , 为 各 种 各 样 的 媒人 式 系 统 编写 程序 时 , 有 哪些 问题 是 原来 编写 “普通 程序 ”时 不 
必 过 于 担心 , 但 现在 需要 特别 关注 的 呢 ? 
。 通常 , 在 媒人 入 式 系 统 中 可 靠 性 (reliability ) 是 至 关 重 要 的 ; 因为 故障 可 能 是 突如其来 的 、 损 
失 巨 大 的 (可 能 “达到 数 十 亿美 元 ” ) 而 且 可 能 是 致命 的 (如 船舶 失事 时 船上 的 人 员 或 者 类 
似 环境 下 的 动物 ) 。 
。 通常 , 在 散人 入 式 系统 中 资源 ( 内存、 处 理 器 、 能 源 等 ) 是 有 限 的 : 对 于 引擎 中 的 计算 机 ,这 
可 能 不 是 一 个 问题 。 但 请 考虑 手机 、 传 感 器 、PDA 、 航 天 探测 器 等 系统 , 其 中 的 资源 问题 
就 很 严重 了 。 在 我 们 的 日 常 应 用 中 , 配置 主 频 2 GHz 的 双核 CPU 和 2GB 内 存 的 笔记 本 很 
常见 , 但 飞机 上 或 航天 探测 器 中 的 关键 计算 机 系统 可 能 只 配备 60 MHz 的 处 理 器 和 256 KB 
的 内 存 , 而 一 个 小 型 装置 中 的 计算 机 系统 可 能 只 有 主 频 低 于 1 MHz 的 处 理 器 和 几 百 个 字 
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的 内 存 。 能 够 抵抗 环境 灾难 (如 振动 、 碰 撞 、 不 稳定 的 电力 供应 、 温 度 过 高 过 低 、 湿 度 过 

高 、 人 为 破坏 等 ) 的 计算 机 通常 比 普通 的 笔记 本 慢 很 多 。 
。 通常 ,在 嵌 和 人 式 系统 中 实时 响应 (real-time response) 是 必需 的 : 如 果 燃 油 喷射 器 错过 了 一 

个 喷射 周期 ， 就 意味 着 一 个 能 输出 十 万 马力 的 非常 复杂 的 系统 会 发 生 糟 糕 的 事情 。 错 过 
尺 (10 米 ) 的 距离 偏差 和 130 吨 的 动力 偏差 。 显 然 你 不 希望 发 生 这 样 的 事情 。 
通常 , 伐 人 式 系 统 需要 一 年 到 头 不 间断 地 正常 运行 : 或 许 计算 机 系统 是 工作 在 绕 地 球 轨道 
运行 的 通信 卫星 上 ; 又 或 许 系 统 非常 便宜 , 因而 制造 量 极 为 巨大 , 较 高 的 返修 率 会 给 厂商 
带 来 极 大 损失 (如 MP3 播放 器 、 带 租 入 式 芯 片 的 信用 卡 以 及 汽车 的 燃油 喷射 器 )。 在 美 
国 , 电话 骨干 网 交换 机 的 强制 可 靠 性 标准 是 20 年 中 停机 时 间 在 20 分 钟 以 内 (这 甚至 没有 
考虑 更 新 交换 机 程序 所 需 的 停机 时 间 ) 。 
通常 , 对 于 藤 入 式 系统 ,手工 维护 (hands-on maintenance ) 是 不 可 行 的 或 者 非常 少见 : 对 于 
一 条 大 型 船舶 , 大 概 每 两 年 左右 进 港 一 次 进行 整体 维护 , 这 时 你 就 可 以 进行 计算 机 系统 的 
维护 了 , 但 前 提 是 计算 机 专家 此 时 恰好 有 时 间 、 又 恰好 在 船舶 停靠 地 。 不 定期 的 人 工 维护 
是 不 可 行 的 , 例如 ， 当 船舶 在 太平 洋 中 央 遇 到 大 风暴 时 , 是 不 允许 出 现任 何故 障 的 。 再 
如 , 你 是 不 可 能 派 人 去 维修 绕 火 星 飞 行 的 航天 探测 锋 的 。 
很 少 有 系统 面临 所 有 这 些 问题 , 但 即使 仅仅 面临 其 中 一 个 问题 , 也 需要 领域 专家 来 解决 。 本 章 的 
目标 不 是 使 你 立刻 成 为 专家 , 设 定 这 样 的 目标 是 很 愚 宫 也 是 很 不 负责 任 的 。 我 们 的 目标 是 使 你 了 
解 基本 问题 和 解决 问题 的 基本 概念 , 使 你 对 构造 这 类 系统 的 基本 技术 有 所 体会 。 也 许 经 过 学 习 
后 , 你 就 会 对 这 些 重 要 的 技术 产生 兴趣 ， DO eb NA 对 
我 们 科技 文明 的 很 多 方面 都 相当 重要 。 

那么 本 章 内 容 与 初学 者 有 关 吗 ? 与 C++ 程序 员 有 关中 ? 回答 是 肯定 的 。 现 实生 活 中 ,， 仍 人 

式 系统 的 数量 远 远 多 于 传统 PC 我 们 的 程序 设计 工作 中 , 有 一 大 部 分 与 租 入 式 系 统 有 关 , 因而 你 
的 第 一 个 实际 工作 就 可 能 涉及 骨 入 式 系 统 程序 设计 。 而 且 , 本 节 开 头 列 出 的 散人 式 系 统 的 例子 ， 
都 是 我 本 人 亲眼 所 见 的 使 用 C++ 进行 程序 设计 的 实际 全 于 。， 


25. 2 基本 概念 


详 信 式 系统 程序 设计 工作 中 的 很 大 一 部 分 与 普通 程序 设计 没有 太 大 区 别 ， 因此 本 书 介绍 的 大 

部 分 概念 和 技术 仍然 适用 。 不 过 , 本章 的 重点 是 描述 两 者 之 间 的 不 同 之 处 : 我 们 必须 调整 程序 设 

计 语 言 工具 的 使 用 方式 ， 以 适应 嵌入 式 系统 的 一 些 限制 而 且 通常 我 们 需要 以 底层 方式 访问 
硬件 : 

”。 正确 性 (corectness) : 对 于 欣 入 式 系 统 , 正确 性 比 普 通 系 统 更 为 重要 。 正确 性 "不 只 是 一 

个 抽象 概念 。 在 嵌入 式 系统 中 , 一 个 程序 的 正确 性 不 仅仅 是 一 个 产生 正确 结果 的 问题 , 还 

意味 着 要 在 正确 的 时 间 得 到 正确 的 结果 以 及 只 使 用 允许 范围 内 的 资源 。 理 想 情 况 下 , 我 

们 要 小 心 、 仔 细 地 定义 正确 性 包 售 哪 些 内 容 , 但 通常 ,完整 的 定义 只 有 在 试验 之 后 才能 

得 。 一 般 来 说 , 整个 系统 都 实现 完毕 后 (不 仅 包括 计算 机 系统 的 实现 , 还 包含 物理 设备 等 

其 他 部 分 ) 才能 进行 关键 性 的 实验 。 完 整 的 正确 性 定义 对 于 舱 和 人 式 系统 来 说 既 非 常 困难 又 

非常 重要 。“ 非 常 困难 ”是 指 “ 给 定 的 时 间 和 可 用 的 资源 不 足以 完成 ”, 我 们 必须 竭尽 所 能 

使 用 所 有 可 用 的 工具 和 技术 。 幸 运 的 是 , 在 某 个 特定 领域 , 可 运用 的 规范 、 仿 真 方法 、 测 
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笋 四 部 分 大 秆 视野 


试 技术 和 其 他 技术 可 能 超 乎 我 们 的 想象 ,有 效 使 用 的 话 可 能 帮助 我 们 完成 目标 。“ 非常 重 
要 "是 指 “ 故 障 会 导致 极 大 的 损害 甚至 毁灭 性 的 后 果 ”。 

容错 (fauit tolerance) : 我 们 必须 仔细 定义 程序 应 该 处 理 哪 些 情况 。 例 如 , 对 于 一 个 普通 的 
学 生 练 习 程序 ,如果 我 们 在 程序 演示 时 距 掉 电线 , 还 要 求 它 能 继续 正常 工作 , 显然 是 不 公 
平 的 。 对 于 一 个 普通 的 PC 应 用 程序 , 不 应 该 要 求 它 能 处 理 电 源 故 障 。 但 是 , 对 于 和 通 人 式 
系统 , 电源 故障 并 不 罕见 , 在 某 些 情况 下 程序 应 该 有 能 力 对 此 进行 处 理 。 例 如 ,系统 的 关 


. 键 部 件 可 能 配备 双 电 源 、 备 用 电池 等 。“ 我 假定 硬件 正常 工作 ”不 应 成 为 应 用 程序 不 进行 


错误 处 理 的 借口 。 因 为 , 经 过 很 长 时 间 运 行 , 面 对 各 种 各 样 的 工作 条 件 , 硬件 发 生 故 障 是 
很 正常 的 。 例 如 , 一 些 电 话 交 换 机 程序 和 一 些 航天 屁 程 序 会 假设 计算 机 内 存 中 的 值 迟 早 


会 发 生 位 偏转 (例如 ,从 0 变 成 1)。 或 者 , 可 能 内 存 中 某 个 位 一 直 保 持 为 1, 将 其 改变 为 0 


的 操作 都 会 被 忽略 掉 。 如 果 内 存 足 够 大 , 而 且 使 用 时 间 较 长 的 话 , 这 类 错误 总 是 会 发 生 。 
如 果 内 存 紧 锯 于 强 辐射 中 , 例如 系统 运行 于 地 球 大 气 层 之 外 ,这 种 错误 就 会 很 快 发 生 。 当 
我 们 设计 一 个 系统 时 (无 论 是 不 是 舰 入 式 系 统 ), 应 该 明确 系统 应 提供 的 容错 能 力 。 通 常 
的 默认 情况 是 假定 硬件 会 按 规 定 方 式 工作 , 对 于 更 重要 的 系统 , 这 个 假设 就 需要 调整 了 。 
不 停机 (no downtime) : 磐 人 式 系统 一 般 需 要 长 时 间 运 行 , 其 间 不 进行 软件 更 新 , 也 无 需 有 
经 验 的 了 解 系统 实现 的 操作 员 人 工 干 预 。 “长 时 间 "可 以 是 几 天 、 几 个 月 、 几 年 甚至 硬件 
的 整个 生命 周期 。 其 他 类 型 的 系统 可 能 也 有 这 样 的 需求 , 但 其 人 式 系 统 与 大 量 “ 普 通 应 
用 ”和 本 书 中 的 示例 程序 、 系 统 程序 有 着 非常 大 的 不 同 。 这 种 “必须 永远 运行 ”的 需求 意味 
着 对 错误 处 理 和 资源 管理 的 极 高 要 求 。 那 “资源 ”又 是 什么 呢 ? 所 谓 资源 就 是 机 器 只 能 提 
供 有 限 数量 的 那些 东西 。 在 程序 中 , 你 需要 显 式 地 获取 资源 (“申请 资源 ”、“ 分 配 ”), 使 
用 完毕 后 还 应 该 将 其 归还 系统 (“释放 ” “release”、“free”、“ deallocate”, 可 以 显 式 或 
隐 式 归还 ) 。 资 源 的 例子 很 多 , 如 内 存 、 文 件 句 柄 、 网 络 连接 ( 套 接 字 ) 和 锁 等 。 对 于 长 期 





运行 的 程序 , 除了 一 些 需 要 一 直 使 用 的 资源 之 外 , 其 他 资源 在 使 用 完毕 后 都 必须 释放 。 例 


如 ,如 果 一 个 程序 每 天 都 筷 记 关闭 一 个 文件 , 会 使 大 多 数 系统 在 大 约 一 个 月 后 毅 泪 。 如 果 
一 个 程序 每 天 都 忘记 释放 100 字 节 的 内 存 , 那么 一 年 中 就 会 浪费 大 约 32KB 内 存 一 一 这 足 
以 令 一 个 小 型 设备 在 几 个 月 后 毅 溃 。 这 种 资源 “泄漏 ”问题 最 令 人 讨厌 的 是 ,程序 会 良好 
运行 几 个 月 , 然后 突然 崩溃 。 如 果 程 序 必然 崩溃 , 那么 我 们 宁愿 它 尽 可 能 早 地 崩溃 ,以 便 
我 们 及 时 发 现 、 修正 错误 。 我 们 希望 系统 能 在 提交 用 户 之 前 就 早早 地 滩 锯 问题 , 而 不 是 在 
用 户 使 用 过 程 中 出 现 错误 。 
实时 性 限制 (real-time constrains) : 对 于 一 个 磐 人 式 系 统 ， 如 果 每 个 操作 都 严 格 要 求 在 一 个 
时 限 之 前 完成 , 那么 我 们 称 它 是 硬 实 时 (hard real time) 的 。 如 果 大 多 数 时 间 要 求 操 作 在 时 
限 内 完成 , 但 对 于 偶尔 的 超时 能 够 忍受 ,那么 就 称 为 软 实 时 (soft real time ) 系统 。 汽 车 车 
窗 控 制 器 和 立体 声音 啊 放 大 融 都 属于 软 实时 系统 : 人 们 不 会 注意 到 车 窗 的 移动 延迟 了 截 
点 几 秒 钟 ; 只 有 受过 训练 的 人 才 会 察觉 到 音 高 变化 时 几 毫 秒 的 延迟 。 一 个 便 实 时 系统 的 


例子 是 燃油 喷射 器 , 喷射 燃油 的 时 间 必 须 严格 地 与 活塞 运动 同步 。 如 果 时 间 偏差 哪怕 零 


.点 几 毫 秒 , 引擎 性 能 就 会 受 影响 , 磨损 也 会 更 严重 。 如 果 时 间 偏 差 更 大 的 话 , 甚至 会 使 引 


人 擎 停止 工作 ,从 而 导致 一 起 事故 甚至 灾难 。 | 
可 预测 性 (predictability) : 对 于 艇 入 式 系 统 程序 来 说 , 可 预测 性 是 一 个 关键 概念 。 显 然 , 这 
个 术语 有 很 多 直观 的 含义 , 但 对 于 艇 人 式 系 统 程序 设计 , 它 有 一 个 专门 的 定义 : 如 果 一 个 
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操作 在 一 台 给 定 的 计算 机 上 每 次 的 执行 时 间 总 是 相同 的 , 而 同类 操作 的 执行 时 间 也 都 是 
相同 的 , 那么 我 们 就 称 这 个 操作 是 可 预测 的 。 例 如 , 知 x 和 y 是 整数 , x +y 的 执行 时 间 是 
不 变 的 , 而 xx +yy(xx 和 yy 也 是 整数 ) 的 执行 时 间 与 x+y 也 总 是 相同 的 。 通 背 , 我 们 可 以 
忽略 由 系统 架构 造成 的 细微 的 运行 时 间 差 异 ( 如 高 速 缓存 和 流水 线 造成 的 运行 时 间 差 
异 ) , 操作 的 运行 时 间 就 取 其 上 限 。 在 硬 实 时 系统 中 , 绝对 不 能 使 用 不 可 预测 的 操作 , 在 
软 实时 系统 中 可 以 使 用 , 但 也 必须 非常 小 心 。 一 个 经 典 的 不 可 预测 操作 的 例子 是 列表 的 
顺序 搜索 (如 find( ) ) , 列表 的 元 素数 目 是 未 知 的 , 也 很 难 给 出 其 上 限 。 只 有 当 我 们 能 确切 
地 预测 列表 元 素数 目 或 者 至 少 是 能 预测 最 大 元 素数 目 时 ,顺序 搜 索 才 能 用 于 便 实 时 系统 。 
也 就 是 说 , 为 了 保证 请 求 在 给 定时 限 内 被 响应 , 我 们 必须 能 够 (也 许 需 要 借助 于 代码 分 析 
工具 ) 计 算 所 有 在 时 限 之 前 可 能 执行 的 代码 流 的 执行 时 间 。 

并 发 性 (concurrency) : 一 个 世 入 式 系 统 通常 需要 响应 来 自 于 外 部 的 事件 。 因而 程序 可 能 需 
要 同时 处 理 很 多 事情 ， 因 为 有 可 能 很 多 外 部 事件 同时 发 生 。 程 序 同时 处 理 多 个 动作 , 称 为 
并 发 (concurrent) 或 并 行 (parallel ) 。 不 幸 的 是 , 那些 吸引 人 的 、 有 难度 的 、 重 要 的 并 行程 
序 设计 知识 已 经 超出 了 本 书 的 讨论 范围 。 
25.2.1 可 预测 性 

C++ 的 可 预测 性 相当 好 , 但 还 不 够 完美 。 除 了 以 下 几 个 语言 言 特性 外 ,所 有 其 他 C++ 语言 特 
性 (包括 虚 函 数 调 用 ) 都 是 可 预测 的 : 

e 动态 内 存 空间 分 配 new 和 delete( 参见 25. 3 节 ) 

e 异常 (参见 19. 5 万) 

e 动态 类 型 转换 dynamic_cast( 参 见 附 录 A. 5.7) 

应 该 避免 在 硬 实时 系统 中 使 用 这 些 语言 特性 。 我 们 将 在 25.3 节 详细 讨论 new 和 delete 所 存在 的 
问题 , 这 是 一 个 根本 性 的 问题 , 任何 语言 实现 都 会 存在 。 注 意 , 标准 库 中 的 string 和 标准 容器 
(vector、map 等 ) 间 接地 使 用 了 动态 内 存 分 配 , 因此 它们 也 是 不 可 预测 的 。dynamic_cast 的 问题 则 

是 当前 实现 所 导致 的 , 而 非 根本 性 问题 。 

异常 的 问题 在 于 ,对 每 个 throw， 如 果 不 考察 更 大 范围 的 代码 ， 程序 员 无 法 知道 需要 花费 多 长 

时 间 才 能 找到 与 之 匹配 的 catch, 其 至 是 否 存 在 这 样 一 个 catch 都 无 法 获知 。. 在 一 个 晓 人 式 系统 程 

序 中 , .最 好 期 盼 确实 存在 这 样 一 个 catech， 而 且 在 抛 出 异常 后 能 及 时 执行 到 这 个 catch。 因 为 我 们 

不 能 只 依赖 调试 工具 的 C++ 程序 员 发 现 这 类 问题 。 如 果 有 这 人 么 一 个 工具 , 它 能 找到 每 个 throw 所 
匹配 的 catch, 并 能 计算 出 多 长 时 间 能 到 达 catch, 就 能 解决 异常 所 面临 的 这 个 问题 了 。 但 到 目前 

为 止 , 这 样 的 工具 还 处 于 研究 阶段 , 离 实 用 还 很 哆 远 。 因 此 ,如 果 程 序 必须 是 可 预测 的 , 你 就 需 

要 使 用 返回 代码 等 老式 技术 来 编写 错误 处 理 程 序 , 虽然 这 类 技术 可 能 元 长 乏味 , 但 它们 是 可 项 

测 的 。 . 

25. 2.2 理想 


编写 般 入 式 系统 程序 的 过 程 中 存在 这 样 一 种 危险 : 对 性 能 和 可 靠 性 的 追求 导 臻 程序 员 4 倒退 到 

只 使 用 低层 语言 特性 的 地 步 。 如 果 是 编写 一 小 段 程序 , 这 样 做 还 是 可 行 的 。 但 是 , 一 般 情况 下 ， 
它 容 易 使 整体 设计 陷 人 混乱 , 使 程序 的 正确 性 难以 验证 , 还 会 大 大 增加 系统 开发 的 成 本 和 时 间 。- 
与 以 往 一 样 , 我 们 的 理想 是 尽量 使 用 较 高 层次 的 抽象 ,以 便 能 够 很 好 地 描述 要 解决 的 问题 。 
不 要 退回 到 编写 汇编 代码 的 地 步 ! 与 以 往 一 样 , 尽 可 能 直接 用 代码 表达 你 的 思想 (已 给 定 的 所 有 
条 件 )。 与 以 往 一 样 , 努力 编写 最 清晰 、 最 干净 、 最 易 维护 的 代码 。 除 非 真 的 需要 , 否则 不 要 执着 
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于 代码 优化 。 性 能 (时 间或 空间 ) 对 一 个 嵌 人 式 系统 通常 很 重要 , 但 是 试图 榨 干 每 一 小 段 代码 的 性 
能 极限 就 是 误 人 歧途 了 。 而 且 , 对 于 很 多 媒人 式 系统 而 言 ， 重要 的 是 正确 性 和 “足够 快 "。 超 越 
“足够 快 ” 就 没有 意义 了 ， 系统 只 能 空闲 下 来 ,等待 进 行 下 一 个 操作 。 在 编写 每 一 小 段 代 码 时 都 试 
图 达到 最 高 效率 , 既 花费 大 量 时 间 , 又 会 导致 大 量 bug, 而 且 通 常 还 会 导致 失去 优化 的 机 会 , 因为 
这 样 实现 的 算法 和 数据 结构 难以 理解 、 难 以 修改 。 例 如 , 这 种 “低层 优化 ”编程 方式 通常 会 导致 内 
存 优化 难以 进行 ， 因为 大 量 相似 的 代码 片段 出 现在 很 多 地 方 ， 但 又 无 法 共享 这 些 代 码 , 因为 它们 
都 有 细微 的 差异 。 

John Bentley( 以 设计 高 效 代码 著称 ) 提出 了 两 条 优化 法 则 ” 

。 第 一 法 则 : 不 要 做 优化 。 

。 第 二 法 则 ( 仅 对 行家 里 手 ) : 还 是 不 要 做 优化 。 

在 进行 优化 之 前 , 必须 确认 你 完全 理解 了 系统 。 唯 有 这 样 ， 你 才能 确信 优化 是 正确 而 又 可 靠 的 。 
在 程序 设计 过 程 中 , 应 该 把 精力 集中 在 算法 和 数据 结构 上 。 te na lo 
再 根据 需要 仔细 测试 、 调 节 系 统 。 幸 运 的 是 , 这 种 朴素 的 程序 设计 策略 也 可 能 带 来 惊喜 : 简洁 
代码 有 时 会 足够 快 而 且 不 会 占用 太 多 的 内 存 。 即 便 有 这 种 可 能 ， 也 不 要 报 太 大 期 望 ， ee 
也 是 很 常见 的 , 还 是 要 进行 仔细 的 测试 。 

25. 2. 3 生活 在 故障 中 

设想 我 们 准备 设计 并 实现 一 个 不 会 失效 的 系统 。 这 里 “不 会 失效 ”的 意思 是 “可 以 在 没有 人 工 
干预 的 情况 下 正常 工作 一 个 月 ”。 那 么 我 们 必须 防御 哪些 类 型 的 故障 呢 ?” 我 们 当然 可 以 排除 太阳 
向 新 星 演变 的 情况 , 系统 被 大 象 躁 踏 的 情况 应 该 也 无 需 考虑 。 但 是 ,一 般 来 说 我 们 很 难 估 计 会 发 
生 什 么 样 的 故障 。 对 于 一 个 特定 系统 ， 我 们 可 以 也 应 该 假定 哪些 故障 更 容易 发 生 ， 例如 : 

。 功率 又 变 / 电 源 故 障 

。 插头 从 插座 上 脱落 

”。 系统 被 落下 的 碎片 击 中 , 处 理 器 被 损坏 

。 系统 坠落 (硬盘 可 能 会 因为 冲击 而 损坏 ) 

。 XX 射线 导致 内 存 中 某 些 位 的 值 不 按 程序 语言 的 定义 而 改变 
瞬时 故障 通常 是 最 难 查找 的 , 所谓 瞬时 故障 (transient error) ; 就 是 指 在 “ 某 些 时 候 ” 会 发 生 , 但 不 
会 在 程序 每 次 运行 时 都 发 生 的 故障 。 例 如 , 我 们 听 说 过 处 理 器 只 有 在 温度 超过 130 华氏 度 (54 摄 
氏 度 ) 时 才 会 行为 异常 , 正常 情况 下 是 不 会 达到 这 么 高 的 温度 的 。 但 是 ,如果 系统 (偶然 地 、 不 小 
心地 ) 堆 积 在 工厂 车 间 的 角落 里 , 散热 不 好 的 话 ， 还 是 有 可 能 达到 这 个 温度 的 ， 当然 系统 在 实验 室 
中 进行 测试 时 不 会 达到 这 个 温度 。 

' 在 实验 室 之 外 发 生 的 故障 是 很 难 修复 的 。 你 很 难 想象 , 为 了 让 JPL 的 工程 师 能 够 监测 火星 巡 
回 者 号 上 的 软件 和 硬件 故障 ,并 能 在 弄 清 问题 后 通过 软件 更 新 的 方式 来 修复 故障 , 在 设计 和 实现 
系统 时 会 花费 多 么 大 的 努力 。 

为 了 设计 和 实现 一 个 具有 容错 能 力 的 系统 , 领域 知识 ( 即 关 于 系统 本 身 、 它 的 工作 环境 及 其 
使 用 方式 的 知识 ) 是 必需 的 。 在 本 章 中 , 我 们 只 能 涉及 一 些 一 般 原则 。 注 意 , 这 里 讨论 的 每 条 “一 
般 原 则 ”都 是 一 个 庞大 的 主题 , 都 有 几 十 年 的 研究 和 开发 历史 , 相关 的 文献 都 数 以 千 计 。 

。 避免 资源 汇 汤 : 绝 不 能 发 生 泄漏 。 要 明确 程序 使 用 哪些 资源 , 要 确保 你 (完全 ) 拥 有 这 些 

资源 。 任 何 泄漏 最 终 都 会 令 系统 或 者 子 系统 崩溃 ,最 重要 的 资源 是 CPU 时 间 和 内 存 。 通 
常 , 程序 还 会 使 用 其 他 资源 ,如 锁 、 通 信 信 道 、 文 件 等 。 
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。 复制 : 如 果 某 个 硬件 资源 (如 计算 机 、 输 出 设备 、 轮子 等 ) 的 正常 运 苇 于 系统 至 关 芋 要 | 纪 
么 设计 者 就 面临 这 样 一 个 基本 的 选择 一 一 是 否 应 该 为 关键 资源 配置 备份 :对 于 硬件 故障 ， 
我 们 要 么 简单 地 承受 故障 , 要 么 配置 热 备 设备 , 在 故障 时 通过 软件 切换 到 热 备 设 备 。 例 
如 , 船用 柴油 机 燃油 喷射 器 的 控制 器 有 三 重 备份 , 备份 之 间 通 过 一 个 双重 备份 的 网 络 链 
接 。 注 意 ,“ 热 备 ” 设 备 不 需要 与 原 设备 完全 一 样 (例如 , 可 能 航天 探测 器 的 主 天 线 接收 能 
力 很 强 , 而 备份 天 线 较 弱 ) 。 而 且 ， 在 系统 无 故障 时 ， “ 热 备 ”设备 通常 也 可 以 投入 工作 ， 
以 提升 系统 性 能 。 

自 检测 : 要 了 解 掌握 程序 (或 硬件 ) 什么 时 候 出 现 故障 。 硬 件 设备 (如 存储 设备 ) 通 常 都 能 
监测 自身 的 运行 状况 , 对 小 故障 进行 修复 ; 将 无 法 处 理 的 严重 故障 报告 给 用 户 , 这 对 于 我 
们 进行 故障 检测 非常 有 帮助 。 软 件 则 可 以 检查 数据 结构 的 一 致 性 , 检查 不 变量 (参见 
9.4.3 节 )， 以 及 依赖 内 部 的 “完整 性 检查 ”( 断言 ) 进行 故障 检测 。 不 幸 的 是 ,， 自 检测 机 制 
本 身 也 有 可 能 是 不 可 靠 的 , 报告 错误 的 过 程 本 身 可 能 导致 一 个 新 的 错误 , 对 这 种 情况 必须 
加 以 小 心 一 一 对 错误 检测 模块 本 身 的 完全 彻底 的 检测 是 非常 困难 的 。 

能 够 迅速 离开 有 错误 的 代码 : 解决 的 策略 就 是 系统 的 模块 化 。 每 个 模块 都 完成 一 项 特 
定 的 工作 , 在 此 之 上 完成 基于 模块 的 错误 处 理 。 如 果 一 个 模块 无 法 完成 自己 的 工作 ， 
它 可 以 将 这 一 情况 报告 给 其 他 模块 。 保 持 模 块 内 的 错误 处 理 尽 量 简单 (这 样 ， 故 障 恢 
复 的 可 能 性 就 更 高 , 修复 效率 也 更 高 ) ,由 其 他 模块 负责 更 严重 的 错误 。 一 个 高 可 靠 
的 系统 一 定 是 模块 化 的 和 层次 化 的 。 在 每 个 层次 中 , 严重 错误 都 报告 给 下 一 层次 来 
处 理 。 最 终 的 层次 ,可 能 是 由 操作 人 员 来 处 理 。 一 个 模块 收 到 一 个 严重 错误 ( 另 一 个 
模块 无 法 自己 处 理 的 错误 ) 的 通知 后 , 可 以 采取 适当 的 措施 , 可 以 重启 错误 模块 , 或 
者 启动 一 个 更 简单 (但 也 更 可 靠 ) 的 “备份 "模块 。 对 于 一 个 给 定 系统 ,准确 定义 什么 是 
“模块 ”, 应 该 是 系统 整体 设计 的 一 部 分 ， 但 你 可 以 把 模块 看 做 一 个 类 、 一 个 库 、 一 个 程序 
或 者 一 台 计 算 机 上 的 所 有 程序 。 

监控 对 子 系统 一 “如 果子 系统 自身 不 能 或 没有 监测 自身 故障 的 话 。 在 一 个 多 层 系统 中 ， 
上 层 模块 可 以 监控 下 层 模 块 。 很 多 不 允许 失效 的 系统 (如 船用 引擎 或 者 空间 站 的 控制 器 ) 
对 关键 子 系统 都 配置 三 重 备份 。 这 种 三 重 备份 不 仅仅 是 为 了 设置 两 个 热 备 设 备 , 还 有 一 
个 很 重要 的 目的 : 在 设备 行为 不 一 致 时 , 通过 投票 , 采用 少数 服从 多 数 的 策略 (一 个 服从 
两 个 ) 来 确定 正确 的 结果 。 在 多 层 结构 很 难 实施 的 地 方 ( 即 系统 的 最 高 层 , 或 者 不 允许 失 
效 的 子 系统 ) , 三 重 备份 就 显得 非常 有 用 了 。 

我 们 可 以 设计 更 多 这 样 的 原则 , 并 在 实现 中 小 心 保证 , 但 系统 仍然 会 出 现 不 可 预知 的 问题 。 因 
此 , 在 交付 用 户 使 用 之 前 , 还 是 需要 进行 系统 的 、 全 面 的 测试 ; 参见 第 26 章 。 


25. 3 内存 管理 


计算 机 中 两 种 最 重要 的 资源 是 时 间 ( 执 行 指令 ) 和 空间 (保存 数据 和 程序 的 内 存 )。 在 C++ 
中 ,有 三 种 分 配 内 存 的 方法 (参见 17.4 节 和 附录 A. 4.2): ， 

。 静态 内 存 : 是 由 连接 器 分 配 的 , 其 生命 期 为 整个 程序 的 运行 期 间 。 

® 栈 内 存 ( 也 称 为 自动 内 存 ) : 在 调用 函数 时 分 配 ， 当 函数 返回 时 释放 。 

e 动态 内 存 ( 也 称 为 堆 ) : 用 new 操作 分 配 , 用 delete 操作 释放 。 
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下 面 ,我 们 从 肯 和 人 式 程序 设计 的 角度 来 考察 这 几 种 内 存 分 配方 式 。 特 别 地 , 我 们 将 把 可 预测 性 
(参见 25. 2. 1 节 ) 作 为 必 备 的 性 质 考虑 在 内 , 也 就 是 说 , 我 们 针对 的 是 硬 实 时 系统 程序 设计 和 安 
全 系统 程序 设计 。 

在 笛 入 式 系 统 程 序 设计 中 ， 静态 内 存 分 配 不 会 引起 任何 特殊 的 问题 ， 因为 所 有 的 内 存 分 配 工 
作 都 在 程序 开始 运行 之 前 就 已 经 完成 了 , 也 远 在 系统 部 署 之 前 。 

栈 内 存 如 果 分 配 过 多 ,就 可 能 导致 一 些 问题 , 但 这 并 不 难处 理 。 系 统 设计 者 须 确保 没有 任何 
程序 在 执行 时 会 使 栈 溢出 , 这 通常 意味 着 函数 调用 的 最 深层 次 不 能 超过 限制 ， 即 我 们 必须 保证 调 
用 链 不 会 太 长 (例如 , f1 调用 也 , 亿 调用 人 名,…, 调用 血 )。 在 某 些 系 统 中 , 可 能 就 需要 禁止 使 用 递 
归 函 数 了 。 这 对 某 些 系统 和 某 些 递归 函数 是 合理 的 , 但 并 不 是 对 所 有 系统 和 递归 了 晤 数 都 如 此 。 例 
如 , 我 们 知道 factorial(10) 最 多 产生 对 factorial 的 10 层 调用 , 因此 可 以 很 容易 确保 栈 不 会 溢出 。 
但 是 ,嵌入 式 系统 程序 员 可 能 更 愿意 使 用 循环 来 实现 factorial( 参见 15.5 节 ) ， 以 避免 任何 疑问 或 
意外 。 

在 嵌入 式 程 序 中 , 动态 内 存 分 配 通常 是 被 禁止 或 者 受到 严格 限制 的 , 即 new 或 者 被 禁止 , 或 
者 只 在 启动 时 使 用 , 而 delete 则 被 严格 禁止 。 基 本 的 原因 是 : 

e。 可 预测 性 : 动态 内 存 分 配 是 不 可 预测 的 , 也 就 是 说 , 它 不 能 保证 在 固定 时 间 内 完成 。 实 际 

上 , 不 能 按时 完成 的 情况 还 不 是 少数 , 因为 许多 new 的 实现 都 有 这 样 一 个 特点 : 在 已 经 分 
配 和 释放 了 很 多 对 象 后 ,再 分 配 新 的 对 象 , 所 花费 的 时 间 会 呈 上 升 趋势 。 

e。 碎片 (fragmentation ) : 动态 内 存 分 配 会 造成 碎片 问题 ， 加寿 分 本 和 区 放 了 大 量 对 象 后 | 

， 每 个 空洞 都 很 小 , 无 法 容纳 
程序 所 需 对象 ， 从 而 使 这 些 空闲 内 存 毫 无 用 处 。 因 此 ,可 用 空闲 内 存量 远 远 小 于 初始 内 存 
总 量 减 去 已 分 配 的 内 存量 。 

下 一 节 会 解释 为 什么 会 出 现 这 种 不 可 接受 的 情况 。 重要 的 是 在 硬 实时 程序 设计 和 安全 程序 设计 

中 , 我 们 必须 避免 使 用 new 和 delete。 下 面 几 节 会 介绍 一 些 方法 , 可 以 使 用 栈 和 存储 池 技 术 系 统 

地 避免 动态 内 存 分 配 带 来 的 问题 。 : 

25. 3. 1 动态 内 存 分 配 存在 的 问题 

new 的 问题 究竟 在 哪里 呢 ? 实际 上 问题 是 出 在 new 和 delete 的 结 合 使 用 上 。 观察 下 面 程序 中 
内 存 分 配 和 释放 的 过 程 : 


Message* get_input(Device&); // make a Message on the free Store z 








while(/* ... */) { 
Message* p= = get- input(dev); 
J ee 
Node* nt = new MOGe la Ane oe 
1 . 
加 delete p; 
Node* n2 = new Node (arg3,arg4); 
1... 
} 


在 每 个 循环 步 中 , 我 们 创建 了 两 个 Node, 在 此 期 间 , 我 们 还 分 配 了 一 个 Message, 然后 又 释 放 了 
它 。 当 我 们 需要 用 某 个 “设备 ”而 来 的 输入 创建 一 个 数据 结构 时 ,常常 会 使 用 这 样 的 代码 。 看 看 这 
段 代码 , 每 执行 一 个 循环 步 , 我 们 可 能 期 望 “消耗 "2 * sizeof( Node) 个 字 节 的 内 存 ( 再 加 上 动态 内 
存 分 配 的 额外 开销 )。 但 不 幸 的 是 , 真正 的 内 存 “ 消耗" 并 不 一 定 如 我 们 所 愿 。 实 际 上 , 每 个 循环 
步 总 是 会 消耗 掉 更 多 的 内 存 。 
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我 们 假定 系统 使 用 一 个 简单 (但 并 非 与 实际 不 符 ) 的 内 存 管理 程序 。 另 外 假定 一 个 Message 比 
一 个 Node 稍 大 。 下 图 展示 了 动态 内 存 的 使 用 情况 , 其 中 用 黑色 表示 ，Node 用 灰色 表示 ， 
而 白色 表示 “空洞 ”"( 芭 “ 未 使 用 空间 ”): 


| 创建 n1 之 后 [个 Messsge 和 一 个 Noda 





图 放 p 之 后 (一 个 “空洞 ”和 一 个 Node) 





St 2 创建 n2 之 后 (两 个 Message 和 一 个 小 “空洞 ”) 


,en 





， | 第 一 个 循环 步 ， 创 建 m7 之 后 





i po Th ah i a i -” 
| 人 | Ra 人 的 一 人 4 | 2 
Na eh i Cd -=<| “ 少 ， n 日 
Lata at Ke i 对 ps dh y i 





由 此 可 见 , 每 执行 一 个 循环 步 , 我 们 就 会 在 动态 内 存 中 留 下 一 些 未 用 空间 (“空洞 ") 。 这 些 空 
洞 可 能 只 有 几 个 字 节 大 小 , 但 如 果 我 们 不 能 加 以 有 效 利用 , 其 危害 与 内 存 泄漏 是 一 样 的 一 一 即使 
是 微小 的 泄漏 ,在 长 时 间 运行 后 也 会 导致 系统 崩溃 。 在 内 存 中 , 空闲 空间 分 散 , 形成 很 多 小 “ 空 
洞 ”, 无 法 满足 新 的 内 存 需求 的 情况 , 就 称 为 内 存 碎片 。 内 存 管理 程序 最 终 会 把 足够 大 的 “空洞 ” 
用 尽 , 只 留 下 无 法 使 用 的 小 空洞 。 这 是 任何 频繁 使 用 new 和 delete 的 系统 长 期 运行 后 都 会 遇 到 的 
一 个 严重 问题 , 最 终 , 内 存 中 布 满 了 无 法 使 用 的 碎片 。 此 时 再 执行 new 操作 ， 就 需要 在 大 量 对 象 
和 碎片 中 搜索 足够 大 的 区 域 , 所 花费 的 时 间 就 会 急剧 增加 。 显 然 , 这 对 于 贬 入 式 系统 来 说 是 不 可 
接受 的 。 对 于 非 嵌入 式 系统 , 这 也 是 一 个 严重 问题 。 

为 什么 不 让 “语言 ”或 “系统 来 处 理 这 个 问题 呢 ? 或 者 ， 我 们 为 什么 不 能 编写 不 会 形成 空 
洞 ”的 程序 呢 ? 我 们 首先 看 一 下 消除 “空洞 "的 最 直接 的 方法 : 移动 Node, .将 空闲 空间 压缩 成 一 片 
连续 的 区 域 , 这 样 就 可 以 用 来 存储 新 的 对 象 了 。 

不 幸 的 是 ,“ 系 统 ” 无 法 完成 这 样 的 任务 。 原因 在 于 C++ 是 直接 用 内 存 地 址 来 访问 对 象 的 。 
例如 , 指针 nl 和 n2 中 都 是 对 象 的 实际 内 存 地 址 。 因 此 ， 如 果 我 们 移动 了 对 象 , 这 些 指针 就 不 再 
指向 正确 的 对 象 , 其 中 的 地 址 就 变 为 无 效 了 。 下 图 给 出 了 指针 保存 对 象 地 址 的 示意 : 





| 法 | 
和 pe 4 








不 幸 的 是 ,由 于 移动 对 象 时 没有 相应 地 众 改 指针 ,现在 的 指针 已 经 乱 七 人 糖 了 。 那 么 我 们 为 什么 
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不 在 移动 对 象 的 同时 修改 指针 呢 ? 我 们 可 以 编写 一 个 程序 来 完成 这 个 工作 , 但 是 前 提 是 必须 知道 
数据 结构 的 细节 。 一 般 情 况 下 ,“ 系 统 ”(C++ 运 行 时 支持 系统 ) 是 无 法 知道 指针 在 哪里 的 , 也 就 
是 说 , 给 定 一 个 对 象 , 无 法 回答 “程序 中 的 哪些 指针 现在 指向 这 个 对 象 "” 。 即 使 可 以 回答 这 个 问 
题 ， 这 种 方法 ( 称 为 压缩 垃圾 收集 ，compacting garbage collection ) 通常 也 不 是 最 好 的 方法 。 例 如 ， 
为 了 完成 收集 任务 , 除了 程序 所 使 用 的 内 存 外 , 还 需要 两 倍 于 此 的 空间 来 跟踪 指针 以 及 移动 对 
象 。 在 共和 人 式 系 统 中 , 是 不 会 有 这 么 多 额外 内 存 空间 的 。 另 外 , 一 个 高 效 的 垃圾 内 存 收 集 程序 很 
难 达到 可 预测 性 。 

我 们 自己 当然 可 以 回答 “指针 在 哪 “的 问题 ,因此 可 以 自己 编写 程序 来 进行 空间 压缩 。 这 是 可 
行 的 ， 但 更 简单 的 方法 是 从 根本 上 避免 碎片 的 出 现 。 在 本 例 中 , 我 们 可 以 在 分 配 Message 之 前 为 


两 个 Node 分 配 空 间 : 

while( . . . ) { 
Node* n1 = new Node; 
Node* n2 = new Node:; 
Message* p= get_input(dev); 
i... store information in nodes . . . 
delete p; 
Mis 

} 


但 是 , 用 重 整 代码 的 方法 来 避免 碎片 问题 通常 比较 困难 。 最 乐观 地 估计 ， 既 避免 碎片 ,同时 又 要 保证 代 
码 仍旧 可 靠 , 也 是 一 项 非常 困难 的 工作 。 而 且 , 代码 的 重 整 可 能 与 其 他 编码 基本 原则 冲突 。 因 此 , 我 们 
倾向 于 限制 动态 内 存 分 配 的 使 用 , 这 样 就 从 根本 上 消除 了 碎片 问题 。 通 常 , 预防 比 治疗 更 有 效 。 
和 将 上 面 的 程序 补充 完整 ， 输 出 创建 的 对 象 的 地 址 和 大 小 ; 观察 是 否 会 出 现 
“空调 " , “空洞 " 又 是 如 何 分 布 的 。 如 果 有 时 间 的 话 ， 试 着 画 一 下 内 存 布局 (就 像 前 面 那 
， 几 个 图 一 样 ), 这 能 帮 你 更 好 地 理解 这 个 问题 。 
25. 3.2 动态 内 存 分 配 的 替代 方法 时 

我 们 已 经 决定 从 根本 上 避免 碎片 , 但 如 何 做 到 呢 ? 首先 , 一 个 简单 的 事实 是 ; 单独 使 用 new 
操作 不 会 导致 碎片 , 用 delete 操作 释放 内 存 时 才 会 产生 空洞 。 因 此 , 我 们 第 一 步 先 禁止 delete。 这 
意味 着 , 一 旦 为 对 象 分 配 了 内 存 空间 , 那么 其 生命 周期 就 会 持续 到 程序 结束 。 

如 果 不 再 使 用 delete 了 , new 就 是 可 预测 的 了 吗 9 也 就 是 说 ;所 有 new 操作 都 会 花费 相同 的 
时 间 了 吗 ? 对 于 一 般 的 实现 , 确实 是 这 样 , 但 并 不 是 所 有 系统 都 保证 如 此 。 通 常 ， 嵌 人 式 系统 中 
都 有 一 段 初始 化 代码 , 在 加 电 或 重启 后 完成 初始 化 任务 。 在 初始 化 期 间 , 我 们 可 以 任意 分 配 内 存 
空间 ,只 要 不 超过 限额 即 可 。 分 配方 式 可 以 使 用 new, 也 可 以 使 用 全 局 (静态 ) 内 存 。 从 程序 结构 
的 角度 来 说 , 应 该 尽量 避免 使 用 全 局 数据 , 但 全 局 内 存 分 配方 式 可 以 实现 内 存 空间 的 预 分 配 。 在 
这 方面 更 准确 的 规则 应 作为 系统 编程 规范 的 一 部 分 (参见 25.6 节 ) 

有 以 下 两 种 数据 结构 在 实现 可 预测 内 存 分 配 时 非常 有 用 : 

。 栈 : 在 栈 中 , 你 可 以 分 配 任意 大 小 的 内 存 空间 (分 配 的 总 量 不 超过 预 设 的 最 大 值 ), 最 后 分 

配 的 空间 总 是 最 先 被 释放 。 也 就 是 说 , 栈 只 在 栈 顶 一 端 增长 和 缩小 。 因 而 也 就 不 存在 碎 
片 问题 ,因为 内 存 空 间 的 分 配 和 释放 是 不 会 交叉 的 。 
。 存储 池 : 所 谓 存储 池 , 就 是 一 组 相同 大 小 的 对 象 的 集合 。 只 要 需 分 配 的 对 象 数 未 超过 存储 池 的 
容量 , 就 可 以 在 其 中 任意 分 配 和 释放 对 象 。 由 于 所 有 对 象 都 是 相同 大 小 , 因此 也 不 会 产生 碎片 。 
采用 栈 和 存储 池 , 分 配 和 释放 都 是 可 预测 的 ， 速 度 也 很 快 。 
这 样 , 对 于 硬 实时 系统 或 者 关键 系统 , 我 们 可 以 视 需 要 自己 定义 栈 和 存储 池 。 但 最 好 能 使 用 
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现成 的 、 已 经 过 测试 的 栈 和 存储 池 代 码 ( 只 要 其 定义 符合 我 们 的 需要 就 可 以 使 用 ) 。 

注意 , 我 们 不 能 使 用 C++ 标准 库 中 的 容器 (vector、map 等 ) 和 string， 因 为 它们 间接 使 用 了 
new。 你 可 以 创建 (购买 或 借用 ) 可 预测 的 “类 标准 ”容器 , 当然 这 些 代 码 的 用 途 不 仅仅 局 限于 其 人 

注意 , 嵌入 式 系统 通常 在 可 靠 性 上 要 求 非常 严格 ,因此 , 无 论 选 择 怎样 的 解决 方案 , 我 们 都 
不 能 倒退 到 直接 使 用 大 量 低层 特性 的 程序 设计 风格 。 充 斥 着 指针 、 显 式 类 型 转换 等 特性 的 代码 ， 
其 正确 性 是 极 难保 证 的 。 
25. 3. 3 ”存储 池 实 例 

存储 池 是 这 样 一 种 数据 结构 , 我 们 可 从 中 分 配 指定 类 型 的 对 象 , 随后 可 将 这 些 对 象 释放 。 下 
图 说 明了 存储 池 的 工作 原理 , 其 中 灰色 表示 “已 分 配 的 对 象 ”, 而 白色 表示 “空闲 空间 ”: 





我 们 可 以 定义 Pool 如 下 : 
tempiate<class T, int N>class Pool{ /Pool of N objects of typeT 
public: - 
Pool(); /make pool of N Ts 
T* getO); // get aT from the pool; return 0 if no free Ts 
void free(T*); // return a T given out by get() to the pool 
int availabie() const; //number of free Ts 
private: 


// space for T[N] and data to keep track of which Ts are allocated 
/and which are not (e.g., a list of free objects) 


}; 
每 个 Pool 对 象 都 包含 类 型 相同 的 一 组 对 象 ， 对象 的 数目 有 上 限 值 。Pool 的 使 用 方法 如 下 面 代 


公所 示 : 
Pool<Small_buffer,10> sb_pool; 
Pool<Status_indicator,200> indicator_pool; 


Small_buffer* p = sb_pool.get(); 
We 8 
sb_pool.free(p); 


程序 员 应 该 确保 存储 池 不 会 被 耗 尽 ,“ 确 保 " 的 准确 含义 依赖 于 具体 应 用 。 对 于 某 些 系统 ,程序 员 
应 该 保证 只 有 在 存储 池 有 空闲 空间 的 情况 下 才 调 用 get( ) 。 在 另外 一 些 系统 中 , 程序 员 可 以 检测 
get( ) 的 返回 值 , 在 返回 值 为 0 的 情况 下 进行 一 些 补救 措施 。 第 二 种 策略 的 一 个 典型 例子 是 电话 
系统 , 假定 它 最 多 同时 处 理 100 000 个 呼叫 。 每 个 呼叫 都 需要 一 些 资源 ， 比 如 一 个 拨号 缓冲 区 。 
如 果 系 统 中 的 拨号 缓冲 区 都 已 耗 尽 ( 如 dial_buffer_pool. get( ) 返 回 0), 系统 可 以 拒绝 建立 新 的 通 
话 连接 (还 可 能 “ 杀 掉 "一些 已 有 的 通话 连接 来 释放 一 些 空间 ) 。 拨 打 电 话 的 人 则 可 以 稍 后 再 拨 。 
当然 , 我 们 的 Pool 模板 仅仅 是 存储 池 一 般 思想 的 一 种 实现 , 还 可 以 根据 需要 选择 其 他 实现 方 
式 。 例 如 ,对 于 内 存 分 配 限 制 不 那么 苛刻 的 系统 , 我 们 可 以 修改 存储 池 的 定义 , 在 构造 函数 中 指 
定 元 素数 目 , 甚至 在 需要 时 改变 元 素数 目 。 
25. 3. 4” 栈 实例 
栈 是 这 样 一 种 数据 结构 , 我 们 可 以 从 中 分 配 内 存 空间 , 而 最 后 分 配 的 区 域 被 最 先 释放 。 下 图 
说 明了 栈 的 工作 方式 , 其 中 灰色 表示 “已 分 配 内 存 ”, 白色 表示 “空闲 空间 ”: : 
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如 上 图 所 示 , 栈 向 右 “ 生 长 ”。 
定义 一 个 对 象 栈 ， 与 定义 一 个 对 象 存储 池 类 似 ; 


template<class T, int N> class Stack { // stack of Ts 
/ss 
}; 
然而 , 大 多 数 系统 都 需要 为 不 同 大 小 的 对 象 分 配 内 存 。 存 储 池 无 法 满足 这 种 需求 , 但 栈 却 可 以 。 
下 面 我 们 就 展示 如 何 定 义 一 个 能 从 中 分 配 大 小 不 同 的 “原始 ”内 存 空间 , 而 非 固定 大 小 对 象 的 栈 。 


template<int N>class Stack { /stack of N bytes 


pubiic: 
Stack(); /make an N-byte stack 
void* get(int n); // ailocate n bytes from the stack; 
// return 0 if no free space 
void free(); // return the jast value returned by get() to the stack 
int available() const; //number of available bytes 
private: 


// space for char[N] and data to keep track of what is allocated 
// and what js not (e.g., a top-of-stack pointer) 

}» , 
get( ) 从 栈 中 分 配 指定 大 小 的 内 存 空间 , 返回 指向 起 始 地 址 的 void* 指针 , 因此 , 我 们 需要 显 式 将 
其 转换 为 所 需 的 类 型 。 这 种 栈 的 使 用 方式 如 下 : 。 


Stack<50*1024> my_free_store; //50K worth of storage to be used as a stack 


void* pv1 = my _free_store.get(1024); 
int* buffer = static_cast<int*>(pv]); 


void* pv2= my _free_store.get(sizeof(Connection)); 
Connection* pconn = new(pv2) Connection(incoming,outgoing,buffer); 


static_cast 的 使 用 已 经 在 17. 8 节 中 介绍 过 了 。 语 法 new( pv2) 表 示 “ 定 址 new”, 即 “ 在 pv2 指向 的 
内 存 空 间 中 创建 一 个 对 象 ” 。 也 就 是 说 , 它 并 不 分 配 新 的 内 存 空间 。 这 有 段 代码 假定 Connection 有 
一 个 构造 函数 ,接受 参数 (incoming，outgoing，buffer) 。 如 果 没 有 定义 这 样 的 构造 郴 数 ,编译 会 
失败 。 

自然 地 ，Stack 模板 也 只 是 栈 的 一 般 思想 的 一 种 实现 而 已 , 还 可 以 有 其 他 的 实现 方式 。 例 如 ， 
如 果 内 存 分 配 的 限制 不 那么 苛刻 , 我 们 可 以 修改 栈 的 定义 ,实现 在 构造 函数 中 指定 预 分 配 的 空间 
大 小 。 


25. 4 地址、 指针 和 数组 


可 预测 性 只 是 某 些 伐 人 式 系统 的 需求 , 而 可 靠 性 则 是 所 有 肯 人 式 系 统 都 需要 的 。 因 此 , 应 该 
避免 使 用 那些 已 被 证 明 容 易 出 错 的 语言 特性 和 程序 设计 技术 (这 里 是 指 在 嵌入 式 系 统 中 容易 出 
错 , 在 其 他 环境 中 并 不 一 定 ) 。 指 针 就 是 这 样 一 种 语言 特性 , 使 用 不 慎 很 容易 导致 错误 , 有 两 个 问 
题 最 为 突出 : 要 

。 (未 经 检查 的 和 不 安全 的 ) 显 式 类 型 转换 

。 将 指向 数组 元 素 的 指针 作为 参数 传递 
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前 一 个 问题 通常 可 以 简单 地 通过 严格 禁止 使 用 显 式 类 型 转换 来 解决 ,指针 /数组 问题 则 更 微妙 ， 
理解 起 来 更 有 难度 ,解决 方法 可 以 使 用 (简单 的 ) 类 或 者 标准 库 功能 (如 array, 参见 20.9 节 )。 
此 , 本 节 主 要 讨论 如 何 解决 指针 /数组 问题 。 
25. 4. 1 未 经 检查 的 类 型 转换 

在 低层 系统 中 , 物理 资源 (如 外 部 设备 的 控制 寄存 器 ) 及 其 基础 软件 通常 位 于 特定 的 地 址 。 我 
们 不 得 不 在 程序 中 直接 使 用 这 些 地 址 , 并 将 它们 转换 为 所 需 类 型 ， 

Device_driver* p = reinterpret_cast<Device_driver*>(0xffb8); 
请 参考 17. 8 节 。 这 种 语法 很 不 常用 , 你 可 能 需要 借助 手册 和 联机 帮助 才 不 会 写 错 。 硬 件 资源 ( 资 
源 的 寄存 器 的 地 址 一 一 通常 表示 为 十 六 进 制 整数 ) 和 指向 硬件 资源 控制 软件 的 指针 之 间 的 对 应 关 
系 是 脆弱 的 。 你 需要 保证 其 正确 性 , 但 又 得 不 到 编译 器 的 帮助 (因为 这 本 来 就 不 是 程序 设计 语言 
方面 的 问题 )。 通 常 ,int 类 型 到 指针 类 型 的 简单 转换 (reinterpret_cast) , 是 连接 一 个 应 用 程序 和 它 
的 重要 硬件 资源 所 必需 的 。 但 这 样 的 转换 是 完全 未 经 检查 的 ,因此 很 容易 出 错 。 

只 要 显 式 类 型 转换 (reinterpret_cast ，static_cast 等 , 参见 附录 A. 5.7) 并 非 必 需 , 就 应 该 避免 使 
用 。 通 常 , 一些 先 前 使 用 C 或 者 C 风格 C++ 的 程序 员 喜 欢 使 用 这 种 类 型 转换 , 但 实际 上 很 多 情 
况 下 是 不 必要 的 。 
25. 4.2 一 个 问题 ; 不 正常 的 接口 

如 上 18. 5. 1 节 所 述 , 一 个 数组 常常 作为 参数 ,以 指针 的 形式 传递 给 函数 (指针 通常 指向 数组 
的 第 一 个 元 素 ) 。 这 样 ， 数组 大 小 就 丢失 ”了 ,从 而 导致 接受 参数 的 函数 无 法 判断 数组 中 共有 多 
少 个 元 素 。 这 个 问题 是 很 多 微妙 而 难以 修正 的 bug 的 根源 。 下 面 , 我 们 考察 一 些 数 组 /指针 问题 
的 例子 , 并 给 出 一 个 替代 方法 。 我 们 以 一 个 非常 差 的 接口 程序 (但 很 不 幸 , 这 个 例子 在 实际 程序 
中 并 不 罕见 ) 作 为 开始 , 然后 尝试 改进 它 :; 

void poor(Shape* p, int sz) /poor interface design 

{ 


for (int i = 0; i<sz; ++i) pli].draw(); 
} 


void f(Shape* q, vector<Circle>& s0) I/ very bad code 
{ 
Polygon s1[10]; 
shape s2[10]; 
I initialize 
Shape* pl = new Rectangle(Point(0,0),Point(10,20)); 
poor(&s0[0],s0.size()); I #1 (pass the array from the vector) 


poorl(s1,10); I #2 
poor(s2,20); li #3 
poor(p1,1); | 
delete pi; 

PIT = 0; 8 
poor(p1,1); Hi#5 
poor(q,max); li #6 


} 
羡 数 poor( ) 是 一 个 设计 得 很 差 的 接口 : 它 使 调用 者 极 易 出 错 , 又 几乎 没有 给 实现 者 预防 错误 
的 机 会 。 
试 一 试 ”在 继续 阅读 之 前 ,尝试 找 出 f( ) 中 的 错误 。 特 别 是 ,对 poor( ) 的 哪 次 调用 
会 导致 程序 谣 溃 ? 
乍 一 看 , 这 些 对 poor( ) 的 调用 没有 什么 问题 , 但 这 些 代 码 正 是 那 种 会 花费 程序 员 整 夜 时 间 来 
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除 错 的 程序 , 对 高 水 平 工程 师 来 说 也 会 是 一 场 亚 梦 。 
1) 元 素 类 型 传递 错误 ,如 poor(&s0[0] , s0. size( ) ) 。 而 且 s0 还 可 能 是 空 的 ， 二 &s010] 本 
身 就 是 错 的 。 

2) 使 用 了 “ 魔 数 ”: poor( sl, 10) (此 处 是 正确 的 ) 。 这 里 , 元 素 类 型 也 是 错误 的 。 

3) 使 用 了 错误 的 “ 魔 数 ” : poor( s2, 20) (此 处 是 正确 的 ) 。 

4) 正确 的 调用 : 第 一 个 poor(pl, 1)。 

5) 传递 了 一 个 空 指针 : 第 二 个 poor(p1, 1)。 - 

6) 可 能 是 正确 的 : poor(q, max)。 仅 看 这 个 代码 片段 ， 不 能 判断 这 个 调用 是 否 正确 。 为 了 判 
断 q 指向 的 数组 是 否 包含 至 少 max 个 元 素 ,， 必须 找到 q 和 max 的 定义 并 获得 程序 运行 到 
此 处 时 它们 的 值 。. : 

RN 我 们 并 未 涉及 微妙 的 算法 或 数据 结构 问题 。 所 有 问题 都 出 在 poor( ) 的 接 

上 , 它 包含 一 个 以 指针 方式 传递 的 数组 , 这 导致 了 一 系列 的 问题 。 你 可 以 体会 一 下 , 我 们 所 使 

pl 和 s0 这 种 无 意义 的 名 字 是 如 何 使 问题 更 加 模糊 不 清 的 。 这 些 名 字 虽 然 有 助 记忆 , 但 容易 
造成 混淆 , 使 得 这 些 错误 更 难以 查找 。. 

理论 上 , 编译 器 可 以 找到 其 中 一 些 错误 (如 第 二 个 poor(pl， yi =0 的 情形 ) 。 但 在 现实 

中 , 我 们 之 所 以 能 免 受 这 些 错误 的 困扰 ,主要 还 是 因为 编译 器 发 现 了 程序 试图 定义 抽象 类 Shape 
的 对 象 。 但 是 , 这 并 未 解决 poor( ) 接 口 方面 的 问题 ， 因 此 我 们 无 法 松口 气 。 接 下 来 , 我 们 将 使 用 
一 个 非 抽 象 的 Shape, 这 样 就 能 专注 于 接口 问题 了 。 

poor( &s0[0] ，s0. size( ) ) 到 底 错 在 哪里 呢 ?&s0[0] 措 向 一 个 Circle 数组 的 首 元 素 ， 因 

此 它 是 一 个 Circle” 指针 。poor 期 待 的 是 一 个 Shape” 指 针 , 而 我 们 传递 给 它 的 是 一 个 Shape 
派生 类 对 象 指针 ( Circle”) 。 这 显然 是 允许 的 : 我 们 需要 这 种 类 型 转换 ， 因 为 面向 对 象 程序 
设计 中 常常 需要 用 同一 段 代码 对 源 于 同一 基 类 (本 例 中 是 Shape) 的 不 同 派生 类 的 对 象 ( 参 见 


14. 2 节 ) 进 行 处 理 。 但 是 ,poor( ) 不 仅仅 把 Shape 作为 一 个 指针 来 使 用 , 还 将 它 作为 数组 使 
用 , 通过 下 标 访问 其 元 素 : 

for (int i = 0; i<sz; ++i) plil.draw(); 
这 段 代 码 顺序 访问 内 存 地 址 &p[0] 、&p[ 1」、&p[2j] 等 上 的 对 象 如 下 图 所 示 : 

就 内 存 地 址 而 言 , 这 些 指针 的 间距 为 sizeof( Shape) (参见 17.3.1 节 )。 但 不 幸 的 是 , 对 于 此 次 
poor( ) 的 调用 ，sizeof( Circle ) 大 于 sizeof( Shape) , 因此 内 存 布局 如 下 图 所 示 : 


&p[I0l  &pfl1l &p[2] 


&p[l0] &pl1] &p[2] 





第 1 个 Circle 第 2 个 Circle 第 3 个 Circle 


也 就 是 说 ,poor( ) 中 调用 draw( ) 时 , 指针 实际 指向 一 个 Circle 对 象 的 中 间 ! 这 很 可 能 立即 导致 程 
序 骨 演 。 

poor( sl , 10) 的 问题 更 为 隐蔽 。 其 中 使 用 了 “ 魔 数 "10,， 因 此 我 们 很 容易 立刻 怀疑 它 是 问题 的 
根源 , 但 实际 上 这 条 语句 中 还 隐藏 着 一 个 更 深层 次 的 问题 。 我 们 使 用 Polygon 数组 作为 poor 的 参 
数 ， 就 不 会 遇 到 Circle 数组 所 面临 的 那些 问题 , 原因 是 Polygon 没有 在 基 类 Shape 的 基础 上 增加 数 
据 成 员 ( 而 Circle 加 入 了 新 的 数据 成 员 , 参见 13.8 节 和 13. 12 节 ) 。 也 就 是 说 ，sizeof( Shape) == 
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sizeof( Polygon) ， 更 一 般 地 讲 ，Polygon 和 Shape 具有 相同 的 内 存 布局 。 换 名 话说, 我 们 真 的 很 ” 幸 
运 ”, 对 Polygon 定义 的 任何 微小 修改 都 会 导致 程序 崩溃 。 因 此 ,当前 的 poor(sl, 10) 可 以 正常 工 
作 , 但 它 是 一 个 bug, 迟早 会 引起 程序 错误 。 这 条 语句 毫 无 疑问 是 低 质 量 的 代码 。 

上 述 这 些 问题 都 是 程序 设计 法 则 ““D 是 B' 并 不 意味 着 “D 的 容器 是 B 的 容器 '” 在 实际 代码 
中 的 体现 (参见 19. 3. 3 节 )。 例 如 : 

class Circle : public Shape {/* ...*/}; 


void fv(vector<Shape>&); 
void f(Shape &); 


void g(vector<Circle>& vd, Circle & d) 
《 


f(d); // OK: implicit conversion from Circle to Shape 
fv(vd); //error: no conversion from vector<Circle> to vector<Shape> 


} 
好 了 , 我 们 已 经 知道 上 述 poor( ) 的 调用 是 非常 糟糕 的 代码 了 , 但 这 种 代码 会 出 现在 般 入 式 程 
序 中 吗 ? 也 就 是 说 , 在 安全 性 和 性 能 要 求 都 很 高 的 领域 中 , 我 们 会 遇 到 这 类 问题 吗 ? 我 们 是 
否 可 以 简单 地 把 这 种 代码 作为 错误 的 根源 ,告诉 “普通 程序 ”的 程序 员 “ 不 要 在 航 入 式 程序 中 
使 用 这 种 代码 ” 呢 ? 灵 怕 还 不 能 这 么 简单 地 处 理 , 因为 很 多 现代 的 肉 入 式 系 统 都 严重 依赖 
GUI, 而 GUI 程序 通常 采用 面向 对 象 程序 设计 方法 开发 ,其 代码 组 织 很 像 前 面 给 出 的 例子 。 
这 方面 的 例子 有 很 多 , 如 iPod 的 用 户 界面 、 一 些 手机 的 用 户 界面 以 及 “小 设备 ”( 包 括 飞 机 ) 
上 操作 人 员 使 用 的 显 式 界面 等 。 另 外 一 个 例子 是 很 多 相似 设备 (例如 很 多 电动 机 ) 的 控制 器 
可 以 构成 一 个 典型 的 类 层次 。 换 句 话 说, 这 种 代码 , 特别 是 这 种 函数 声明 方式 , 确实 会 在 骸 
入 式 程序 中 出 现 , 我 们 必须 加 以 考虑 。 我 们 需要 一 种 更 安全 的 方法 来 传递 一 组 数据 ， 以 避免 
引起 上 述 严 重 的 问题 。 
因此 , 我 们 不 希望 数组 参数 以 “指针 + 大 小 "的 方式 传递 。 那 么 有 什么 替代 方法 吗 ? 最 简单 的 
方法 是 传递 容器 (如 vector) 的 引用 , 例如 ; 
void poor(Shape* p, int sz); 
就 不 存在 先前 的 函数 接口 所 存在 的 那些 问题 : 
void general(vector<S$hape>&); 
0 std :: vector( 或 者 等 价 的 工具 ) 是 可 用 的 , 那么 在 函数 接口 中 就 一 直 使 用 
， 而 不 要 以 指针 加 大 小 的 方式 传递 内 置 数组 。 
如 果 你 无 法 使 用 vector 或 等 价 的 工具 , 就 会 陷 和 人 困境 , 虽然 可 以 直接 使 用 我 们 定义 的 接口 类 
Array_ref, 但 仍旧 需要 一 些 复杂 的 语言 特性 和 技术 来 编写 程序 。 
25. 4.3 解决 方案 : 接口 类 
不 幸 的 是 , 在 很 多 般 和 式 系统 中 我 们 都 不 能 使 用 std :: vector, 因为 它 依赖 动态 内 存 分 配 。 
一 种 解决 方法 是 实现 一 个 特殊 的 vector, 更 简单 的 方法 是 定义 一 个 与 vector 功能 相似 但 又 不 
使 用 动态 内 存 分 配 的 容器 。 在 给 出 这 个 容器 的 定义 之 前 , 先 思 考 一 下 我 们 希望 这 个 容器 具有 什 
么 功能 : 
。 它 只 是 内 存 中 对 象 的 一 个 引用 ( 它 不 拥有 对 和 象 .不 分 配 、 释 放 对 象 ) 。 
。 它 “ 知 道 ”" 自 己 的 大 小 (这 样 就 有 可 能 实现 范围 检查 )。 
。 它 “知道” 元 素 的 确切 类 型 (这 样 它 就 不 会 成 为 类 型 错误 的 根源 ) 。 
。 传递 代价 (拷贝 ) 低 , 传递 方式 可 以 是 一 个 (指针 , 数量 ) 对 。 
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e 它 不 能 显 式 地 转换 为 一 个 指针 。 

。 通过 接口 对 象 , 能 容易 地 描述 元 素 范 围 的 子 区 域 。 

。 它 和 内 置 数 组 一 样 容易 使 用 。 
我 们 只 是 尽 可 能 地 接近 “和 内 置 数 组 一 样 容易 使 用 ”这 一 目标 , 实际 上 也 不 应 完全 “一 样 容易 使 
用 ”, 因为 那样 就 意味 着 “一 样 容易 引起 错误 ”。 

下 面 给 出 了 接口 类 的 一 个 定义 : 


template<class T> 
class Array_ref { 
public: 
Array_ref(T* pp, int s) :p(pp), sz(s) {} 


T& operator[ ](int n) { return pln]; } 
const T& operator[ ](int n) const {.return p[n]; } 


bool assign(Array_ref a) 

{ 
if (a.sz!=sz) return false; 
for (int i=0; i<sz; ++i) { pli]j=a., Pl]; } 
return true; 


void reset(Array_ref a) { reset(a.p,a.sz); } 
void reset(T* pp, int s) { p=pp; sz=s; } 


int Size() const { return sz; } 


// default copy operations: 

/ Array_ref doesn't own any resources 

i/ Array_ref has reference semantics 
private: 

Tp; 

int sz; 


}»; 
这 个 接口 类 Array_ref 已 经 尽 可 能 地 简化 了 : 
e 没有 定义 push_back( ) (因为 可 能 需要 动态 内 存 分 配 ), 也 没有 定义 st( ) (可 能 需要 使 用 异 
党 机制 )。 
，@ Array_ref 本 质 是 一 种 引用 , 因此 复制 操作 只 复制 (p，size), 而 不 会 复制 引用 的 对 象 。 
。 不同 的 Array_ref 可 以 用 不 同 的 数组 进行 初始 化 , 这 样 它们 具有 相同 的 类 型 , 但 大 小 不 
一 样 。 
e 我 们 可 以 使 用 reset( ) 来 更 新 (p， size) 的 值 , 这 样 就 可 以 改变 Array_ref 的 大 小 (很 多 工法 要 
求 指定 子 区 域 )。 
。 没有 定义 迭 代 器 接口 (如 果 和 需要 的 话 ， NI 实际 上 , Array_ref 本 质 上 
很 接近 由 两 个 迭代 器 描述 的 一 个 范围 。 
Array_ref 并 不 拥有 元 素 , 也 不 进行 内 存 管理 , 它 只 不 过 是 一 种 访问 及 传递 元 素 序 列 的 机 制 。 在 这 
一 点 上 , 它 与 标准 库 的 array( 参 见 20. 9 节 ) 是 不 同 的 。 
为 了 简化 Array_ref 的 初始 化 , 我 们 设计 了 一 些 有 用 的 辅助 函数 ， 


tempiate<class T> Array_ref<T> make_ref(T* pp, int s) 


{ 
return (pp) ? Array_ref<T>(pp,s) : Array_ref<T>(0,0); 
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如 果 我 们 用 一 个 指针 来 初始 化 Aray_ref, 那么 就 必须 显 式 地 提供 数组 的 大 小 。 这 显然 是 Array_ref 
的 一 个 弱点 , 因为 调用 者 有 可 能 提供 错误 的 大 小 。 而 且 ， 如 果 调 用 者 传递 来 的 指针 是 从 一 个 派生 


类 指针 隐 式 转换 为 基 类 指针 的 ,如 将 Polygon[ 10] 传 递 给 Shape”, 那么 我 们 在 25. 4. 2 节 中 讨论 的 
那个 棘手 的 问题 就 又 出 现 了 。 但 是 , 只 要 保留 这 种 初始 化 方式 , 这 个 问题 就 很 难 解决 , 我 们 有 时 
只 能 相信 程序 员 。 

前 一 段 代码 中 我 们 对 空 指针 进行 了 检查 ( 因为 它 通常 是 错误 之 源 ) , 我 们 同样 也 应 提防 空 vector: 


template<class T> Array_ref<T> make_ref(vector<T>& v) 


{ 
return (v.size()) ? Array_ref<T>(&v[0],v.size()) : Array_ref<T>(0,0); 


过 vector 初始 化 Array_ref, 虽然 在 很 多 Array_ref 的 应 应 用 场合 (和 通信 式 系 统 ) 中 并 不 
适宜 使 用 vector。 不 过 , 与 适合 在 租 入 式 系统 中 使 用 的 容器 (如 基于 存储 池 的 容器 , 参见 25. 3.3 
节 ) 相 比 ，vector 具有 很 多 相似 的 特点 。 

最 后 的 一 个 辅助 函数 利用 内 置 数 组 (编译 器 知道 其 大 小 ) 来 初始 化 Array_ref: 


template <class T, int s> Array_ref<T> make_ref(T (&pp)[s}]) 


{ 
return Array_ref<T>(pp,s); 


} 
T(&pp)[s] 的 语法 有 些 奇怪 , 它 声明 了 一 个 引用 类 型 参数 pp, pp 引用 的 是 一 个 元 素 类 型 为 T、 元 
素 个 数 为 s 的 数组 。 这 样 ,就 可 以 使 用 数组 来 初始 化 Array_ref 了 (数组 大 小 是 已 知 的 )。 由 于 
C++ 不 允许 声明 空 数 组 , 所 以 这 里 不 必 对 此 进行 检测 : 

Poiygon ar[0]; // error: no elements 
有 了 Array_ref 后 , 我 们 就 可 以 重 写 25.4.2 中 的 例 程 了 : 

void better(Array_ref<Shape> a) 

{ 


for (int i = 0; i<a.size(); ++i) a[li].draw(); 
} 


void f(Shape* q, vector<Circle>& s0) 
{ 


Polygon s1[10]; 

Shape s2[20]; 

Hh initialize 

Shape* pl1 = new Rectangle(Point(0,0),Point(10,20)); 
better(make_ref(s0)); // error: Array_ref<Shape> required 
better(make_ref(s1)); // error: Array_ref<Shape> required 
better(make_ref(s2))， // OK (no conversion required) 
better(make_ref(p1,1)); // OK: one element 

delete p1; 

p1= 0; 


better(make_ref(p1,1)}; //OK: no elements 
better(make_ref(q,max)); // OK (if max is OK) 
) 


.。 代码 更 简洁 。 程 序 员 大 多 数 情况 下 无 需 考虑 大 小 , 即便 某 些 时 候 需 要 考虑 ， 也 仅仅 局 限于 
Array_ref 初始 化 的 部 分 , 而 不 会 出 现在 代码 其 他 位 置 。 
。 解决 了 Circle[ ] 转 换 为 Shape[ ] 、Polygon[ ] 转换 为 Shape[ ] 所 存在 的 问题 。 
。 隐 含 地 解决 了 sl、s2 所 存在 的 错误 的 元 素数 目 问题 。 
。 max 的 潜在 问题 (以 及 其 他 的 指针 指向 的 元 素数 目 问题 ) 变 得 更 为 明显 了 , 这 里 是 我 们 唯 
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一 需要 显 式 地 处 理 大 小 的 地 方 。 
。 我们 系统 地 、 隐 式 地 解决 了 空 指 针 和 空 vector 问题 。 
25. 4.4 ”继承 和 容器 
但 是 , 如 果 我 们 需要 将 Circle 对 和 象 序列 作为 Shape 对 象 序列 来 处 理 , 也 就 是 说 , 我 们 确实 需要 
better( ) (实际 上 是 draw_all( ) 的 变形 , 参见 19. 3.2 节 和 22. 1.3 节 ) 来 处 理 多 态 , 又 该 怎么 办 呢 ? 
基本 上 , 这 是 办 不 到 的 。 在 19. 3.3 节 和 25.4.2 节 中 , 我 们 已 经 看 到 , 类 型 系统 有 很 充分 的 理由 拒 
绝 将 vector < Circle > 作为 vector < Shape > 来 处 理 。 基 于 同样 理由 ，Array_ref < Circle > 也 不 能 作为 
Array_ref < Shape > 。 如 果 你 起 记 了 这 部 分 内 容 , 最 好 重新 阅读 19. 3. 3 节 , 因为 这 是 一 个 非常 基础 
的 程序 设计 原则 , 虽然 它 有 些 不 方便 。 
而 且 , 为 了 防止 运行 时 的 多 态 行为 , 我 们 必须 通过 指针 (或 者 引用 ) 来 访问 多 态 对 象 : better( ) 
中 是 不 该 使 用 pl ij. draw( ) 的 。 当 我 们 一 看 到 对 多 态 对 象 使 用 点 操作 符 而 不 是 箭头 ( - > ) 时 , 就 
该 想到 可 能 要 出 问题 了 。 
那么 我 们 应 该 怎么 做 呢 ? 首先, 必须 使 用 指针 (或 引用 ) 来 访问 对 象 , 因此 , 在 例子 程序 中 应 该 使 用 
Aray_ref < Circle” > 、 Aray_ref < Shape” > 等 , 而 不 是 Aray_ref < Circle > 、Array_ref < Shape > 等 。 
但 是 , 我 们 又 不 能 将 Array_ref < Circle”> 转换 为 Array_ref < Shape”> ,否则 接 下 来 的 代码 就 
可 能 将 一 些 不 是 Circle” 的 元 素 放 人 Amay_ref < Shape”> 中 。 不 过 , 我 们 可 以 钻 个 空子 : 
。 在 这 个 例子 中 , 我 们 并 不 想 修改 Array_ref < Shape”> , 而 只 是 想 将 形状 画 出 来 ! 这 是 一 个 
有 趣 而 且 有 用 的 特例 : 由 于 我 们 不 修改 Array_ref < Shape ”> ， 上 述 不 该 将 Armray _ref 


< Circle”> 转换 为 Array_ref < Shape”> 的 理由 也 就 不 成 立 了 。 
。 所 有 指针 数组 都 具有 相同 的 内 存 布局 (不 管 指 针 指向 的 是 什么 类 型 的 对 象 ) ,因此 我 们 不 
会 陷 人 25.4.2 市 所 述 的 布局 问题 。 
也 就 是 说 , 将 Array_ref < Circle”> 作为 不 可 变 的 (immutable) Array_ref < Shape”> 来 处 理 , 不 存在 
任何 问题 。 接 下 来 , 我 们 只 要 找到 这 样 一 种 转换 方法 就 可 以 了 , 请 看 下 图 : 


‘vector<Circle*> 






array of Circle* 让 et 2 A i ks 


将 这 样 一 个 Circle” 数组 作为 一 个 不 可 变 的 Shape” 来 处 理 ( 利用 Array_ref) , 在 逻辑 上 是 没有 任何 
问题 的 。 

看 起 来 我 们 已 经 同人 专家 领域 。 事 实 上 , 这 个 问题 确实 非常 棘手 , 用 现 有 的 工具 是 很 难 解 
决 的 。 但 是 , 我 们 还 是 先 来 看 一 下 如 何 为 这 个 有 问题 但 又 很 常见 的 接口 模式 (指针 间 题 和 元 素数 
量 问 题 , 参见 25. 4.2 市 ) 找 到 一 种 接近 完美 的 解决 方案 吧 。 请 记 住 ; 不 要 为 了 显示 自己 的 聪明 而 
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进入“ 专家 领域 "。 通 常 来 说 , 最 好 的 开发 策略 是 从 库 中 找到 专家 们 已 经 设计 实现 好 并 已 经 过 测试 
的 工具 , 直接 使 用 它们 。 
首先 , 我 们 重 写 better( ) , 对 多 态 对 象 的 访问 全 部 改 用 指针 , 以 确保 我 们 不 会 “ 弄 乱 ”给 定 的 容器 : 


void better2(const Array_ref<Shape*const> a) 
{ 
for (int i = 0; ica.size(); ++i) 
if (afil) 
a[lil->draw'(); 
} 


由 于 改 用 了 指针 ,所 以 我 们 必须 检测 指针 是 否 为 空 。 为 了 确保 better2( ) 不 会 通过 Amay_ref 修改 
数组 或 向 量 的 内 容 , 我 们 使 用 了 两 个 const。 第 一 个 const 保证 我 们 不 会 对 Array_ref 使 用 修改 (更 
新 ) 操 作 , 如 assign( ) 和 reset( ) 。 第 二 个 const 放 在 * 之 后 , 表示 这 是 一 个 常量 指针 (不 是 指向 常量 
内 容 的 指针 ) ， 即 我 们 不 希望 修改 指针 本 身 ( Array_ref 的 元 素 ) 。 

接 下 来 , 我们 需要 解决 核心 问题 : 如 何 表达 如 下 意图 ? 


e Array_ref < Circle ”> 可 以 转换 为 类 似 Array_ref < Shape”> 的 东西 (这 样 就 能 在 better2( ) 中 
使 用 ) 。 


。 但 是 只 能 转换 为 不 可 变 的 Array_ref < Shape ”> 。 
我 们 可 以 通过 定义 一 个 转换 运算 符 来 实现 上 述 目 标 ; 
template<class T> 
class Array_ref { 
public: 
I/ as before 


template<class Q> 
operator const Array_ref<const Q>() 
{ 


I check implicit conversion of elements: 
static_cast<Q>(*static_cast<T*>(0)); 


I cast Array_ref: 
return Array_ref<const Q>(reinterpret_cast<Q*>(p),s2); 
} 


I as before 

] 

这 段 代 码 有 点 令 人 头疼 , 不 过 基本 要 点 如 下 : 

e 类 型 转换 运算 符 实现 到 Amray_ref < const Q > 的 转换 ， 对 于 给 定 的 类 型 0, 它 先 将 
Array_ref <T > 的 一 个 元 系 转 换 为 Array_ref < Q > 的 元 素 ( 我 们 并 不 使 用 转换 的 结果 ， 只 是 
检验 一 下 转换 是 否 可 行 ) 。 

。 接 下 来 ,转换 运算 符 使 用 强制 类 型 转换 (reinterpret_cast) 获得 一 个 指定 元 素 类 型 的 指针 ， 
来 构造 新 的 Array_ref < const Q > 。 强 制 转 换 通常 会 有 额外 开销 , 因此 , 不 要 对 多 重 继承 的 
类 进行 Array_ref 类 型 转换 (参见 附录 A. 12. 4)。 

。 请 注意 Array_ref < const Q > 中 的 const, 它 的 作用 就 是 保证 不 会 将 Array_ref < const Q > 复制 
到 老 版 本 的 可 变 的 Array_ref <Q > 中 。 

我 们 已 经 敬告 过 你 , 你 已 经 进入 了 “ 令 人 头疼 "的 “专家 领域 "。 不 过 , 这 个 版 本 的 Aray_ref 还 是 
比较 容易 使 用 的 ( 令 人 头疼 的 只 是 定义 和 实现 ， 而 非 应 用 ) : 
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void f(Shape* q, vector<Circle*>& s0) 

{ 
Polygon* s1I10]; 
Shape* s2[20]; 
// initialize 
Shape* pi1 = new Rectangle(Point(0,0),10); 
better2(make_ref(s0)); // OK: converts to Array_ref<Shape*const> 
better2(make_ref(s1)); 1 OK: converts to Array_ref<Shape*const> 
better2(make_ref(s2)); // OK (no conversion needed) 
better2(make_ref(p1,1)); error 
better2(make_ref(q,max)); // error 


} 
最 后 两 条 语句 对 指针 的 使 用 是 错误 的 ,因为 两 个 指针 是 Shape” 类 型 ,而 better2( ) 需要 的 是 一 个 


Array_ref < Shape”> 类 型 的 参数 。 也 就 是 说 ,better2( ) 需 要 的 是 包含 指针 的 容器 ,而 非 指 针 本 身 。 
如 果 我 们 希望 将 指针 传递 给 better2( ) ， 就 必须 将 指针 置 于 容器 中 (如 内 置 数组 或 vector) 传递 。 对 
于 一 个 单独 的 指针 , 我 们 可 以 使 用 make_ref( &p1, 1), 虽然 看 起 来 有 些 繁 拙 , 但 能 够 达到 目的 。 
但 是 , 对 于 数组 (包含 多 于 一 个 元 案 ) ,如果 不 创 建 指向 元 素 的 指针 , 再 置 于 一 个 容器 中 ,是 没有 
办 法 处 理 的 。 

总 之 ,我 们 可 以 创建 简单 .安全 、 易 于 使 用 并 且 高 效 的 接口 ,来 弥补 数组 的 不 足 。 这 就 是 本 节 的 
主要 目的 “通过 间接 方式 解决 每 个 问题 *( 引 自 David Wheeler) 已 经 被 作为 “计算 机 科学 第 一 定 
律 ”。 这 就 是 我 们 解决 这 个 接口 问题 所 采用 的 方法 。 


25.5 位 、 字 节 和 字 


在 本 书 前 面 的 章节 中 , 我 们 已 经 讨论 过 内 存 人 硬件 层次 的 一 些 概念 ， 如 位 、 字 节 和 字 。 但 在 普 
通 程序 设计 中 , 我 们 不 会 过 多 考虑 这 些 概念 , 我们 思考 问题 的 方式 是 将 数据 看 做 特定 类 型 的 对 
象 , 如 double 、string、Matrix 以 及 Simple_window。 在 工人 式 程序 设计 中 , 我 们 必须 对 内 存 的 低层 
组 织 方式 有 更 多 的 了 解 , 在 本 节 中 , 我 们 会 对 此 进行 讨论 。 

如 果 你 对 整数 的 二 进 制 和 十 六 进 制 表示 的 相关 知识 不 太 了 解 , 请 参考 附录 A. 2. 1. 1。 
25. 5. 1 位 和 位 运算 

一 个 字 节 可 以 看 做 8 个 位 的 序列 : 





注意 , 位 编号 的 习惯 顺序 是 由 右 (最 低 有 效 位 ) 至 左 ( 最 高 有 效 位 ) 。 类 似 地 ， 一 个 字 也 可 看 做 4 个 
字 节 的 序列 : 





编号 顺序 同样 是 由 右 至 左 ， 即 从 最 低 有 效 位 到 最 高 有 效 位 。 这 两 个 图 过 分 简化 了 现实 世界 中 的 情 
况 : 曾经 存在 一 个 字 节 有 9 位 的 计算 机 (虽然 没有 一 台 的 寿命 超过 10 年 ), 而 一 个 字 包 含 两 个 字 
节 的 计算 机 就 更 常见 了 。 不 过 , 只 要 你 记得 在 使 用 “8 位 ”和 “4 字 节 ”这 两 个 特性 之 前 查阅 一 下 系 
统 手册 , 就 不 会 出 现 问题 了 。 

如 果 希 望 程序 是 可 移植 的 , 那么 请 在 程序 中 使 用 < limits > (参见 24.2. 1 节 ) 以 确保 类 型 大 小 
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不 会 弄 错 。 

在 C++ 中 我 们 如 何 来 表示 一 组 二 进 制 位 呢 ? 答案 取决 于 我 们 要 处 理 多 少 位 ， 以 及 争 望 哪些 
操作 更 方便 和 高 效 。 我 们 可 以 将 整 型 值 当 做 一 组 二 进 制 位 来 使 用 : 

e。 bool 一 一 1 位 , 但 占用 整个 字 节 的 空间 

es _ char 一 一 8 位 
16 位 
通常 是 32 位 , 但 在 很 多 藤 入 式 系统 中 是 16 位 
32 位 或 人 4 位 
上 面 列 出 的 都 是 典型 的 类 型 大 小 , 但 在 不 同 的 实现 中 可 能 有 所 不 同 。 因 此 , 最 稳妥 的 方法 是 实际 
测试 一 下 。 另 外 , 标准 库 中 也 提供 了 处 理 位 的 方法 : 

e std :; vector < bool > 一 一 当 我 们 需要 超过 8 * sizeof( long) 个 二 进 制 位 时 使 用 

e std :: bitset 一 一 当 需 要 超过 8 * sizeof( long) 个 位 时 使 用 

。 std :: set 一 一 无 序 的 、 命 名 的 二 进 制 位 集合 (参见 21. 6. 5 节 ) 

。 文件 : 海量 的 二 进 制 位 (参见 25. 5.6 节 ) 
而 且 ， sh inl ia ad 

。 枚 举 (enum) , 参见 9.5 节 

s 位 域 , 参见 25.5.5 节 
这 么 多 表示 “位 ”的 方法 ， 从 一 个 侧面 反映 了 ;: 在 计算 机 内 存 中 , 实际 上 任何 数据 最 终 都 表示 为 一 
组 二 进 制 位 , 因此 人 们 迫切 地 需要 提供 很 多 方法 来 查看 位 、 命 名 位 以 及 完成 位 运算 。 注 意 , 所 有 
内 置 语言 特性 都 是 处 理 固定 数量 的 二 进 制 位 (如 8、16、32 和 64) , 因此 可 以 直接 使 用 硬件 提供 的 
指令 以 最 佳 性 能 进行 运算 。 与 之 相对 , 标准 库 特性 都 能 处 理 任意 数量 的 位 。 这 可 能 会 影响 性 能 ， 
但 不 要 忙 着 下 结论 : 如 果 你 能 将 一 组 二 进 制 位 很 好 地 映射 到 下 层 硬 件 , 这 些 库 特性 通常 都 有 很 好 
的 性 能 。 

我 们 先 来 考察 用 整数 表示 二 进 制 位 的 方式 。C++ 提供 了 硬件 直接 支持 的 位 运算 , 这 些 运算 都 
是 对 运算 对 象 逐 位 进行 操作 








© Short 





® int 





® long int 





位 运算 

| 或 如 果 x 的 第 n 位 为 1 或 ?的 第 n 位 为 1, 则 xly 的 第 n 位 为 1 

& 与 如 果 x 的 第 n 位 为 1 且 y 的 第 n 位 为 1, 则 x&y 的 第 n 位 为 1 

人 异 或 如 果 x 的 第 n 位 为 1 或 y 的 第 n 位 为 1 且 不 同时 为 1, 则 x&y 的 第 n 位 为 1 
<< 左 移 位 x<<s 的 第 n 位 是 x 的 第 n+s 位 

>> 右 移 位 x>>s 的 第 n 位 是 x 的 第 n-s 位 

~ 补 ~x 的 第 n 位 是 x 的 第 n 位 的 取 反 


你 可 能 觉得 将 “ 异 或 "(“,， 有 时 称 为 “xor'  ) 作为 一 个 基本 运算 有 些 奇怪 ， 但 在 很 多 图 形 和 加 密 程序 
中 , 异 或 是 一 个 基本 运算 。 

编译 器 不 会 把 移 位 运算 符 ”<<” 误 认为 是 一 个 输出 操作 符 , 但 人 有 可 能 犯 这 样 的 错误 。 为 了 
避免 混淆 , 请 记 住 输出 操作 符 的 左 操作 对 象 是 一 个 ostream, 而 移 位 运算 符 的 左 运算 对 象 是 一 
个 整数 。 | : 

注意 ,，“&” 与 “&&” 是 不 同 的 ,“1” 与 “11” 也 是 不 同 的 ,“&” 和 “1” 会 对 运算 对 象 的 每 一 位 独 
立 进行 计算 (参见 附录 A. 5.5), 计算 结果 的 位 数 与 运算 对 象 相同 。 与 之 相反 ,“&&” 和 “11” 只 是 
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返回 true 或 false。 
我 们 来 尝试 一 些 例 子 。 我 们 常常 用 十 六 进 制 表 示 位 的 模式 , 下 表 列 出 了 半 字 节 值 (4 位 ) 的 十 
六 进 制 和 一 进 制 表示 : 





十 六 进 旬 位 模式 
0x0 1000 
Oxl 1001 
0x2 1010 
0x3 1011 
Ox4 1100 
Ox5 1101 
0x6 1110 
0x7 1111 


当 数 值 小 于 9 时 , 我 们 可 以 使 用 十 进 制 , 但 使 用 十 六 进 制 可 以 提醒 我 们 现在 是 在 思考 位 模式 。 对 
于 字 节 和 字 , 十 六 进 制 非常 用。 一 个 字 节 中 的 二 进 制 位 , 可 以 表示 为 两 个 十 六 进 制 数字 , 例如 : 


十 六 进 制 字 节 位 模式 
0x00 0000 0000 
0x0f 0000 1111 
0xf 1111 0000 
Ox 1111 1111 
Oxaa 1010 1010 
Ox55 0101 0101 
在 进行 位 运算 时 , 使 用 unsigned (参见 25.5.3 节 ) 可 以 令 情 况 更 简单 , 避免 一 些 不 必要 的 问 


题 。 例如 : 


unsigned char a = Oxaa; 
unsigned char x0 = ~a; / complement of a 





unsigned char b = 0x0f; 
unsigned char x1 =a&b; //aandb 





unsigned char x2=a^b; /exclusive or: a xorb 
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unsigned char x3 = a<<1; // left shift 1 





注意 , 最 低位 (第 0 位 ) 填 人 了 一 个 0, 可 以 看 做 是 从 第 0 位 右边 “ 移 来 ”的 。 而 原来 的 最 高 位 
(第 7 位) 被 简单 丢弃 。 


unsigned char x4 == a>>2; // right shift 2 





最 高 两 位 (第 6 位 和 第 7 位 ) 都 填 人 了 0, 可 以 看 做 是 从 第 7 位 左边 “ 移 来 "的 , 最 低 两 位 (第 1 位 和 
第 0 位 ) 被 简单 丢弃 。 

在 处 理 位 运算 时 , 就 可 以 像 这 样 画 出 位 模式 ， 这 样 的 图 示 能 使 我 们 对 位 模式 有 一 个 很 好 的 直 
观感 觉 。 不 过 , 对 于 更 复杂 的 例子 , 手工 画 出 位 模式 就 太 演 珊 了 。 下 面 的 这 个 小 程序 能 将 整数 转 
换 为 二 进 制 位 描述 形式 : 


int main() 
{ 
int i; 
while (cin>>i) 
cout << dec <<i << "==" 
<< hex << "0x" << i1<< "==" 
<< bitset<8*sizeof(int)>(i) << \n'; 


} 
其 中 使 用 了 标准 库 中 的 bitset 来 打印 整数 的 某 个 位 : 

bitset<B8*sizeof(int)>(i) 
一 个 bitset 是 一 组 固定 数量 的 二 进 制 位 。 在 本 例 中 , 我 们 使 用 一 个 整数 中 所 能 容纳 的 那么 多 二 进 
制 位 ,也 就 是 8 * sizeof( int) , 并 用 整数 i 来 初始 化 bitset。 

试 一 试 “ 编译、 运行 这 个 例子 程序 , 试 着 输入 一 些 整 数 , 体会 二 进 制 和 十 六 进 制 表 

示 形 式 。 如 果 你 对 负数 的 表示 形式 感到 迷惑 ,请 在 阅读 23. 5.3 节 后 再 重 试 。 

25. 5.2 bitset 


标准 库 模 板 类 bitset 是 在 < bitset > 中 定义 的 , 它 用 于 描述 和 处 理 二 进 制 位 集合 。 每 个 bitset 
的 大 小 是 固定 的 , 在 创建 时 指定 : 


bitset<4> flags; 
bitset<128> dword_bits; 
bitset<12345> lots; 


默认 情况 下 ，bitset 被 初始 化 为 全 0, 但 通常 我 们 都 会 给 它 一 个 初始 值 , 可 以 是 一 个 无 符号 的 整数 
或 者 由 0 和 1 组 成 的 字符 串 。 例 如 : 


bitset<4> flags = Oxb; 
bitset<128> dword._bits(string("1010101010101010")); 


bitset<12345> lots; 
这 两 段 代码 中 ，lots 被 初始 化 为 全 0，dword_bits 的 前 112 位 被 初始 化 为 全 0, 后 16 位 由 程序 指定 。 
如 果 你 给 出 的 初始 化 字符 串 中 包含 0 和 1 之 外 的 符号 ，bitset 会 抛 出 一 个 std :: invalid _ 
argument 异常 : 


570 淄 四 部 分 大乱 帘 叶 


string $s; 
cin>>s; 
bitset<12345> my_bits(s); // may throw std::invalid_argument 


常用 的 位 运算 符 都 可 用 于 bitset 。 例如 》 假定 bl » b2 和 b3 都 是 bitset ， 
b1 = b2&b3; /and 
b1= b2|b3; /or 
b1 = b2Ab3; /xor 
b1= ~b2;  //complement 
b1 = b2<<2; /shift left 
b1 = b2>>3; /shift right 


基本 上 , 对 于 位 运算 而 言 bitset 就 像 unsigned int( 人 参见 25. 5. 3 节 ) 一 样 ， 只 不 过 其 大 小 任意 ， 由 用 
户 指定 。 你 能 对 unsigned int 做 什么 (除了 算术 运算 之 外 ) , 就 能 对 bitset 做 什么 。 特 别 地 ，bitset 对 


VO 也 很 有 用 : 
cin>>b; / read a bitset from input 
cout<<bitset<8>('c'); // output the bit pattern for the character ‘c: 

当 读 入 bitset 时 ， 输入 流 会 寻找 0 和 ls 例如 》 如 果 输 入 下 面 内容 : 
10121 


输入 流 会 读 入 101, 21 会 被 留 下 。 

对 于 字 节 和 字 ，bitset 中 的 位 是 由 右 至 左 编 号 的 (从 最 低 有 效 位 到 最 高 有 效 位 )。 这 样 , 第 7 
位 的 值 就 是 2 : 
对 于 bitset 而 言 , 编号 顺序 不 仅仅 是 遵循 惯例 的 问题 , 还 起 到 7: 6: 5: 4: 3: 2: 1: 0 
二 进 制 位 的 索引 下 标的 作用 。 例 如 : TO 


int main() 


{ 





const int max = 10; 
bitset<max> b; 
while (cin>>b) { 
cout << b << \n'; . 
for (int i =0; i<max; ++i) cout << b[i]; // reverse order 
cout << \n'; 
到 
} 
如 果 你 希望 了 解 bitset 的 更 多 内 容 , 请 参考 联机 帮助 、 手 册 或 者 专业 级 的 教材 。 
25. 5. 3 有 符号 数 和 无 符号 数 


与 大 多 数 语 言 一 样 ， C++ 同时 支持 有 符号 数 和 无 符号 数 。 无 符号 数 在 内 存 中 的 描述 是 
很 简单 的 : 第 0 位 表示 1、 第 1 位 表示 2, 第 2 位 表示 4, 依 此 类 推 。 但 是 , 有 符号 数 就 引出 
一 个 问题 : 我 们 如 何 区 分 正 数 和 人 负数 ? 对 此 , C++ 给 了 硬件 设计 者 一 定 的 自由 选择 的 余地 ， 
不 过 几乎 所 有 实现 都 使 用 了 二 进 制 补 码 表示 法 。 最 靠 左 的 二 进 制 位 (最 高 有 效 位 ) 用 来 作为 
“符号 位 ”: 





oh a i i Dy i i ey A E 
pa i, 二 四 二 0 a PE 
es nl ee 


如 果 符 号 位 为 1, 就 表示 负数 。 二 进 制 补 码 表示 法 事实 上 已 经 成 为 标准 方法 。 为 了 节约 篇 幅 , 我 
们 只 讨论 如 何在 4 位 二 进 制 整数 中 表示 有 符号 数值 : 
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正 数 : 0 1 2 4 玫 
0000 O0001 0010 0100 0111 

负数; 1111 1110 1101 1011 1000 
一 】 一 2 -了 一 3 一 8 


基本 思想 就 是 : 用 x 的 位 模式 的 补 码 ( ~ xi 参见 25. 5. 1 节 ) 来 表示 - (x +1) 的 位 模式 。 
到 目前 为 止 , 我 们 一 直 在 使 用 有 符号 整数 (如 int) 。 更 好 的 程序 设计 原则 是 ; 
。 当 需 要 表示 数值 时 , 使 用 有 符号 数 ( 如 int) 。 
。 当 需 要 表示 位 集合 时 , 使 用 无 符号 数 ( 如 unsigned int) 。 
这 是 一 个 很 好 的 程序 设计 原则 , 但 很 难 严 格 遵循 ,因为 一 些 人 更 喜欢 用 无 符号 数 进 行 某 些 算术 运 
算 , 而 我 们 有 时 需要 用 这 类 代码 。 特 别 是 还 有 一 些 历史 遗留 问题 , 例如 , 在 C 语言 历史 的 早期 ， 
int 还 是 16 位 大 小 , 每 一 位 都 很 重要 , 而 一 个 vector 的 大 小 v. size ( ) 返回 的 是 一 个 无 符号 
数 。 例 如 ， 
Vector<int> v; 
ee i = 0; iev,size(); ++i) cout << v[i] << "n'; 
好 的 编译 需 会 给 出 一 个 警告 , 指出 存在 有 符号 数 ( 即 i) 和 无 符号 数 ( 即 v. size( ) ) 混 合 运 算 的 情况 。 
有 符号 数 和 无 符号 数 混合 运算 有 可 能 会 市 来 灾难 性 的 后 果 。 例 如 , 循环 变量 i 可 能 会 溢出 ， 即 
v size( ) 有 可 能 比 最 大 的 有 符号 int 值 还 要 大 。 当 i 的 值 增 大 到 有 符号 int 所 能 表示 的 最 大 正 数 (2 
的 寡 减 1， 寡 次 等 于 int 的 二 进 制 位 数 减 1, 如 int 为 16 位 宽度 , 此 值 为 2” -1) 时 , 下 一 次 增 1 运 
算 不 会 得 到 更 大 的 整数 值 , 而 会 得 到 一 个 负数 。 因 此 循环 永远 也 不 会 停止 ! 每 当 我 们 到 达 最 大 整 
数 时 , 接着 就 会 从 最 小 负 int 值 重新 开始 。 因 此 , 如 果 v size( ) 的 值 为 32 * 1024 或 者 更 大 , 循环 变 
量 为 16 位 int 型 的 话 , 这 个 循环 就 是 一 个 (可 能 非常 严重 的 )bug。 如 果 循 环 变量 是 32 位 int 型 的 
语 ,， 当 v. size( ) 的 值 大 于 等 于 2 * 1024 * 1024 * 1024 时 就 会 出 现 同 样 的 问题 。 
因此 , 严格 来 说 , 本 书 中 的 大 部 分 循环 都 是 有 问题 的 。 换 名 话说 , 对 于 和 通 人 式 系 统 , 我 们 要 
么 证 实 循环 不 会 达到 临界 点 , 要么 将 循环 代码 改写 为 另外 一 种 形式 。 为 了 避免 这 个 问题 , 我 们 可 
以 使 用 vector 提供 的 size_type 或 是 迭代 器， 
for (vector<int>: :size_type i = 0; jcyv,size(); ++i) cout << v[i] << \n'; 
for (vector<int>: :iterator p = v.begin(); pl=v.end(); ++p) cout << *p << \n'; 
size_type 确保 是 无 符号 的 , 因此 , 第 一 种 形式 (使 用 无 符号 数 ) 与 int 型 循环 变量 的 版 本 相 比 , 多 出 
一 个 二 进 制 位 来 表示 循环 变量 的 数值 (而 不 是 符号 ) 。 这 个 改进 很 重要 , 但 终究 只 是 多 出 一 位 来 表 
示 循 环 的 范围 ( 循环 次 数 多 出 一 倍 ) 。 而 使 用 迭代 器 的 版 本 就 不 存在 这 个 限制 。 
试 一 试 下面 这 个 例子 看 起 来 没什么 问题 , 但 它 实际 上 是 个 死 循 环 : 
void infinite() 
unsigned char max = 160; I very large 


for (signed char i=0; i<max; ++i) cout << int(i) << "n'; 
} 


运行 这 个 程序 , 解释 为 什么 会 形成 死 循环 。 

基本 上 , 我 们 将 无 符号 数 当 做 整数 来 使 用 有 两 个 原因 , 而 不 是 简单 作为 一 组 二 进 制 位 ( 即 不 
使 用 + 、- 、* 和 /) : 

se。 有 更 多 的 二 进 制 位 来 表示 数值 , 从 而 获得 更 高 的 精度 。 
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。 用 来 表示 逻辑 属性 , 其 值 不 能 是 负数 。 
前 者 就 是 我 们 刚刚 看 到 的 , 使 用 无 符号 循环 变量 带 来 的 效果 。 

混合 使 用 有 符号 数 和 无 符号 数 的 问题 在 于 , 在 C++ 中 (在 C 中 也 一 样 ), 两 者 转换 的 方式 很 
奇怪 ,而且 难 以 记忆 。 例 如 : 


unsigned int ui = -1 ; 

int si = ui; 

int si2 = ui+2; 

unsigned ui2 = ui+2; 
奇怪 的 是 , 第 一 个 初始 化 操作 能 够 成 功 完成 , ui 被 赋予 4294967295, 这 个 32 位 无 符号 整数 的 位 模 
式 恰 好 与 有 符号 数 -1 相同 ( 二进制 表示 为 “全 1”)。 一些 人 认为 这 样 编写 代码 很 简洁 ,因此 育 欢 
用 -1 表示 “全 1 ,而 男 外 一 些 人 则 认为 这 是 一 个 不 好 的 特性 。 从 无 符号 数 到 有 符号 数 的 转换 规 
则 与 此 类 似 ， 因 此 第 二 个 初始 化 操作 将 si 的 初 值 设置 为 - 1。 如 我 们 所 料 ，si2 被 赋予 
1( -1+2==1)，ui2 也 被 赋予 同样 的 值 。ui2 的 计算 结果 应 该 会 让 你 感到 惊讶 : 为 什么 
4294967295 +2 会 得 到 1? 如 果 我 们 将 4294967295 表示 为 十 六 进 制 0xffffffff， 就 比较 清楚 了 ， 
4294967295 是 最 大 的 32 位 无 符号 整数 , 因此 4294967297 无 法 用 32 位 整数 表示 , 无 论 是 无 符号 或 
是 有 符号 都 不 行 。 我 们 可 以 说 4294967295 +2 产生 了 溢出 ， 或 者 更 准确 地 说 , 这 里 使 用 了 模 运算 。 
也 就 是 说 , 32 位 整数 运算 都 要 对 2” 取 模 。 

现在 所 有 事情 都 清楚 了 吗 ? 即使 你 已 经 弄 清 了 这 些 奇 怪 的 规则 , 我 们 也 希望 上 述 讨论 能 使 你 
信服 这 样 一 个 观点 : 用 无 符号 数 表示 数值 , 以 获得 一 个 额外 的 二 进 制 位 的 精度 , 无 异 于 玩 火 ,这样 
做 会 导致 混乱 , 而 且 是 潜在 的 错误 之 源 。 

如 果 发 生 整 数 溢出 , 会 有 什么 后 果 呢 ? 考虑 下 面 代 码 : 


inti= 0; 
while (++D print(); /printias an integer foliowed by a space 


这 段 程序 会 输出 什么 样 的 数值 序列 呢 ? 显然 , 这 取决 于 Int 是 如 何 定 义 的 (注意 , 这 里 大 写 的 了 并 
不 是 打字 错误 ) 。 对 任何 一 种 大 小 有 限制 的 整数 类 型 , 最 终 都 会 出 现 溢 出 的 情况 。 如 有 果 Int 是 无 符 
号 类 型 (如 unsigned char、unsigned int 或 unsigned long long) ,由 于 “ ++” 运算 会 进行 模 运 算 ， 循环 
变量 i 达到 最 大 值 后 会 变 为 0( 循 环 从 而 终止 )。 如 果 Int 是 有 符号 类 型 (如 signed char), i 达到 最 
大 值 后 会 突然 变 为 最 小 的 负数 然后 逐渐 增 大 为 0( 循 环 终止 ) 。 例 如 ,如 果 Int 是 signed char, 输出 
的 序列 为 12…126 127 -128 -127… -2 -1。 

再 次 提出 那个 问题 : 如 果 发 生 整 数 溢出 会 有 什么 后 果 ? 答案 是 程序 还 会 继续 执行 ,就 好 像 有 
更 多 二 进 制 位 保存 结果 一 样 , 但 实际 上 一 些 无 法 容纳 的 二 进 制 被 丢弃 了 。 一 般 的 策略 是 丢弃 最 靠 
左 的 位 (最 高 有 效 位 )。 如 果 在 赋值 语句 中 赋予 变量 一 个 超出 其 表示 范围 的 值 , 也 会 看 到 类 似 


的 效果 : 
int si = 257; /1 doesn't fit into a char 
char c = sj; / implicit conversion to char 


unsigned char uc = 5j; 
signed char sc = si; 
print(si); print(c); print(uc); print(sc); cout << \n'; 


si = 129; / doesn'tfit into a signed char 
c= si; 

UC 三 si; 

sc = $i; 

print(si); print(c); print(uc); print(sc); 
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输出 结果 为 
257” 1 1 1 
129 -127 129 -127 


产生 这 样 的 结果 的 原因 是 , 257 比 8 个 二 进 制 位 所 能 表示 的 最 大 值 (255, 即 “8 个 1”) 大 2; 129 比 
7 个 二 进 制 位 所 能 表示 的 最 大 值 (127, 即 %7 个 1”) 大 2, 因而 符号 位 被 置 位 , 有 符号 变量 的 值 变 为 
负数 。 注 意 , 程序 的 运行 结果 表明 : 在 我 们 的 计算 机 上 ，char 是 无 符号 的 , 因为 e 的 行为 与 uc 一 
致 ， 而 与 sc 不 同 。 
试 一 试 ” 在 纸 上 画 出 上 面 程 序 中 涉及 的 位 模式 ， 算 出 若 si =128, 输出 结果 是 什么 。 

运行 程序 , 检验 你 的 手 算 结果 是 否 正 确 。 

插 一 句 : 我 们 为 什么 要 引入 print( ) 函数 ? 我 们 可 以 试 试 : 

cout <<i<< " ; 
原因 很 简单 ,如果 i 是 char 型 , 这 条 语句 就 会 输出 一 个 字符 , 而 不 是 其 整数 值 。 因 此 , 我 们 引入 
print( ) 函数 , 对 所 有 整数 类 型 进行 一 致 处 理 , 定义 如 下 : 


tempiate<class T> void print(T i) { cout <<i<< \t'; } 
void print(char i) { cout << int(i) << \t'; } 

void print(signed char i) { cout << int(i) << \t'; } 
void print(unsigned char i) { cout << int(i) << \t'; } 


总 结 一 下 : 无 符号 数 的 使 用 可 以 和 有 符号 数 完全 一 样 (包括 普通 的 算术 运算 ), 但 是 要 避免 这 样 使 
用 , 因为 这 样 做 会 使 问题 变 得 非常 复杂 , 程序 也 容易 出 错 。 

。 永远 不 要 为 了 多 出 一 个 二 进 制 位 的 精度 而 用 无 符号 数 表 示 数 值 。 

。 如果 你 需要 一 个 额外 的 二 进 制 位 , 很 快 就 会 再 需要 一 个 。 

不 幸 的 是 , 无 符号 数 的 算术 运算 是 很 难 完全 避免 的 : 

。 标准 库容 器 的 下 标 都 是 无 符号 数 。 

。 一 些 人 就 是 喜欢 无 符号 数 的 算术 运算 。 
25.5.4 位 运算 

我 们 为 什么 需要 位 运算 呢 ? 好 吧 , 实际 上 大 多 数 人 并 不 喜欢 位 运算 。 位 处 理 靠近 下 层 而 
且 容 易 出 错 , 有 可 能 的 话 就 应 该 尽量 使 用 蔡 代 方法 。 但 是 , 位 描述 和 位 运算 是 非常 基础 的 ， 
也 是 非常 有 用 的 , 我 们 不 能 假装 它 不 存在 。 这 听 起 来 有 些 消极 , 有 些 令 人 气 馒 , 但 值得 仔细 
思考 。 一 些 人 确实 喜欢 摆弄 位 和 字 节 , 因此 应 当 记 住 : 位 处 理 在 某 些 时 候 是 不 可 避免 的 ( 虽 
然 开始 时 有 些 不 情愿 , 但 在 过 程 中 你 很 可 能 获得 不 少 乐趣 ) , 但 不 要 在 程序 中 到 处 使 用 位 运 
算 。John Bentley 的 两 句 话 用 在 这 里 很 适合 :“ 喜 弄 位 者 易 被 位 反 鸣 (bitten)”,“ 喜 型 字 节 者 
易 被 字 节 反 哈 ( bytten)”。 z 

那么 , 什么 时 候 应 该 使 用 位 运算 呢 ? 有 些 情况 下 , 应 用 程序 要 处 理 的 对 象 就 是 位 的 形式 , 那么 
使 用 位 运算 就 是 顺理成章 的 了 。 这 方面 的 例子 包括 硬件 指示 器 (“标识 位 ”) 、 低 层 通 信 ( 需 要 从 字 节 
流 中 提取 不 同类 型 的 值 )、 图 形 应 用 (需要 用 多 个 层次 的 图 像 组 成 图 片 ) 以 及 加 密 (参见 下 一 节 ) 。 

例如 , 考虑 如 何 从 一 个 整数 中 提取 (低层 ) 信息 (可 能 我 们 想 将 它 按 字 节 传 输 ,就 像 二 进 制 O 
的 处 理 方式 ) : 
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void f(short val)  / assume 16-bit 2-byte short integer 

{ ; 
unsigned char left = val&0xff; // leftmost (least significant) byte 
unsigned char right = (val>>8)&0xff; rightmost (most significant) byte 
/Ry 


booji negative = val&0x8000; / sign bit 
人 


 】} 
这 种 运算 是 很 常见 的 , 通常 称 为 “ 移 位 和 掩 码 ” 运 算 。“ 移 位 ”运算 (使 用 * << "或 “ >> ”) 将 二 进 制 位 
移动 到 我 们 所 期 望 的 位 置 (本 例 中 是 移动 到 字 的 最 低 有 效 位 ), 以 方便 处 理 。“ 掩 码 ” 运 算是 将 运算 对 
象 与 一 个 特殊 的 位 模式 (本 例 中 是 0xf) 进行“ 位 与 ”(&) 运 算 , 目的 是 去 掉 那 些 我 们 不 需要 的 位 。 

如 果 希 望 对 二 进 制 位 命名 , 我 们 通常 使 用 枚 举 类 型 , 例如: 


enum Printer_flags { 
acknowledge=]1, 
paper_empty=1<<1, 
busy=1<<2， 
out_of_black=1<<3, 
out_of_color=1<<4, 
ye 


}; 

每 个 枚 举 常 量 被 赋予 的 值 与 名 字 的 含义 是 完全 吻合 的 : 
out_of_color 16 0x10 0001 0000 
out_of_black 8 0x8 0000 1000 
busy 4 0x4 0000 0100 
paper_empty 2 0x2 0000 0010 
acknowledge 1 0x1 0000 0001 


这 种 常量 值 在 某 些 情况 下 是 很 和 用 的 , 因为 它们 可 以 任意 组 合 : 
unsigned char x = out_of_color | out_of_black; //x becomes 24 (16+8) 
x|= paper_empty; // x becomes 26 (24+2) 


注意 , 这 里 的 “1 = ”起 到 了 “和 置 位 ”的 作用 。 类 似 地 ,“&” 可 以 起 到 “检测 位 ”的 作用 ,例如 : 
if (x& out_of color){  //is out_of_color set? (yes, it is) 
下 
} 


命名 二 进 制 位 同样 可 以 用 来 进行 掩 码 运 算 : 

unsigned char y =x &(out_of color | out_of black);  //x becomes 24 
此 时 , y 的 内 容 就 是 x 的 第 3 位 和 第 4 位 (out_of_black 和 dituok eolor 对 应 第 3、4 位 )。 

将 enum 作为 二 进 制 位 集合 来 使 用 , 是 一 种 十 分 常用 的 方法 。 此 时 , 我 们 就 需要 一 种 方法 将 
位 运算 的 计算 结果 再 “转换 回 "enum: 

Flags z = Printer_flags(out_of_color | out_of_black); // the cast is necessary 
之 所 以 需要 这 样 的 类 型 转换 ,是 因为 编译 器 不 知道 out_of_color | out_of_black 的 值 是 否 是 合法 的 
Flags 值 。 编 译 器 的 怀疑 是 合理 的 : 毕竟 , 没有 任何 一 个 枚 举 常量 的 值 为 24 (out_of_color | out_of_ 
black 的 计算 结果 ) 。 当 然 , 在 本 例 中 , 我 们 知道 赋值 语句 是 合理 的 (但 编译 器 并 不 知道 ) 。 
25. 5.5 位 域 z : 二 

如 前 所 述 , 硬件 接口 是 使 用 位 运算 最 多 的 地 方 。 通常 , 接口 就 是 一 组 二 进 制 位 和 不 同 大 小 的 
数 。“ 二 进 制 位 和 数 " 通 常 是 命名 的 , 出 现在 字 的 不 同位 置 , 我 们 称 之 为 "设备 寄存 器 "。C++ 提 
供 了 一 种 特殊 的 语言 特性 来 处 理 这 种 固定 的 数据 布局 : 位 域 (bitfields) 。 我 们 来 考察 这 样 一 个 例 
子 : 操作 系统 中 页 管理 程序 所 使 用 的 页 号 , 其 结构 为 : 


甸 254 划 由 入 式 系 统 程 序 讼 矿 575 





到 


可 以 看 到 , 一 个 32 位 的 字 被 分 为 两 个 数值 域 ( 一 个 占用 22 位 ， 一 个 占用 3 | 和 4 个 标识 位 ， 这 些 数据 
的 大 小 和 位 置 是 固定 的 。 在 字 的 中 间 还 有 一 个 “未 用 ” 域 。 此 数据 布局 可 用 如 下 struct 类 型 来 描述 : 


struct PPN { // R6000 Physical Page Number 
unsigned int PFN : 22; /Page Frame Number 
int :3， // unused 
unsigned int CCA : 3 ; / Cache Coherency Algorithm 
bool nonreachable ; 1 ; 
bool dirty : 1; 
bool valid : 1; 
booj global ; 1 ; 
by 


我 们 必须 查阅 参考 手册 才 知 道 PFN 和 CCA 应 该 定义 为 无 符号 整数 , 但 如 果 没 有 手册 的 帮助 , 我 
们 可 以 直接 利用 位 模式 图 来 设计 struct。 ee 每 个 域 的 位 宽 用 一 个 整 
数 指定 , 名字 和 位 宽 之 间 用 冒号 隔 开 。 不 允许 为 位 域 指定 绝对 的 位 置 (如 第 8 位 ) 。 如 果 总 位 宽 超 
出 了 一 个 字 的 容纳 能 力 , 则 超出 部 分 被 置 于 下 一 个 字 中 。 和 希望 这 种 方式 能 满足 你 的 需求 。 定 义 完 
成 后 , 位 域 的 使 用 就 与 其 他 变量 没什么 差别 了 : 


void part_of VM_system(PPN * p) 
{ 
// ..， 
if (p~>dirty) {// contents changed 
/ copy to disk 
p->dirty=0; 


// ... 


如 果 没 有 位 域 要 想 获 得 一 个 字 中 间 区 域 的 信息 ,就 必须 使 用 复杂 的 移 位 和 掩 码 运 算 ， 位 域 使 这 


一 切 变 得 简单 。 例 如 , 对 于 一 个 PPN 类 型 的 对 象 pn, 可 以 这 样 提取 CCA: 
unsigned int x = pn.CCA; // extract CCA 


如 果 是 用 一 个 int 型 变量 pni 表示 页 号 , 则 必须 这 样 来 提取 CCA: 


unsigned int y = (pni>>4)&0x7; // extract CCA 
也 就 是 说 , 先 将 CCA 右 移 到 最 低 有 效 位 , 然后 与 0x7( 即 最 右 3 位置 位 ) 进行 掩 码 运 算 来 去 掉 所 有 
其 他 位 。 你 可 以 查看 一 下 编译 得 到 的 机 句 码 ,多半 会 发 现 生 成 的 代码 就 是 这 两 个 指令 

CCA 、PPN 和 PFN 这 种 字 头 缩写 形式 是 常见 的 低层 程序 设计 风格 ,显然 ， 在 设计 普通 程序 时 ， 
这 并 不 是 一 种 好 的 风格 。 
25. 5.6 实例 : 简单 加 密 

接 下 来 , 我 们 实现 一 个 简单 的 加 密 算法 : 微型 加 密 算法 (Tiny Encryption Algorithm, TEA), 作 
为 位 / 字 节 级 别 数据 处 理 的 一 个 实例 。 这 个 算法 最 初 是 由 剑桥 大 学 的 David Wheeler 设计 的 (参见 
22.2.1 节 )。 它 很 简单 , 但 应 付 一 般 攻 击 还 是 绰绰有余 的 。 

你 不 必 过 于 仔细 地 阅读 加 密 程 序 ( 除 非 你 真 的 需要 理解 算法 , 而 且 对 困难 有 心理 准备 ) 。 我 们 给 
出 这 个 加 密 程 序 只 是 为 了 让 你 体会 一 下 如 何 编写 实用 的 位 处 理 代 码 。 如 果 你 希望 学 习 加 密 的 知识 ， 
请 查阅 专门 的 教材 。 至 于 用 其 他 语言 实现 TEA 算法 的 相关 内 容 , 请 参考 http: //en. wikipedia. org/ 
wikiATiny_Encryption_Algorithm 以 及 英国 布 拉 福 德 大 学 Simon Shepherd 教授 关于 TEA 的 网 站 。 

加 密 /解密 的 基本 思想 是 很 简单 的 。 我 想 发 送 给 你 一 些 文本 , 但 我 不 想 让 其 他 人 看 懂 发 送 的 
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内 容 。 因 此 , 我 先 把 要 发 送 的 文本 进行 转换 , 然后 再 发 送 , 使 得 不 知道 确切 转换 方式 的 人 就 无 法 
看 懂 转 换 后 的 内 容 ; 而 你 是 知道 转换 方法 的 , 可 以 通过 逆 变 换 得 到 原始 文本 。 这 个 转换 过 程 就 称 
为 加 密 。 进 行 加 密 需 要 一 个 算法 (我 们 必须 假定 所 有 人 都 能 获得 这 个 算法 ) 和 一 个 称 为 “ 密 钥 ”的 
字符 串 。 你 和 我 都 知道 密 钥 (我 们 希望 窃听 者 不 知道 ) 。 当 你 获得 密 文 时 ， 可 以 使 用 " 密 钥 ” 对 其 
解密 ， 即 重新 构造 出 我 要 发 送 的 “明文 ”。 

TEA 算法 接受 三 个 参数 , v 是 包含 两 个 无 符号 long(v[0], v[1]) 的 数组 , 表示 要 加 密 的 8 个 
字符 , w 是 用 来 保存 密 文 的 , 也 是 包含 两 个 无 符号 long(w[0] , w[1]) 的 数组 , 而 k 是 密 钥 , 是 包 
含 4 个 无 符号 long(kL0]…k[3]) 的 数组 : 

void encipher( 

const unsigned long *const v, 


unsigned long *const w, 
const unsigned long * const k) 


unsigned long y = v[0]; 
unsigned long z = v[1]; 
unsigned long sum = 0; 
unsigned long delta = 0x9E377989; 
unsigned long n = 32; 
while(n—— > 0) { 
y+= (Z<<4z>>5)+z sum + k[sume&3]; 
sum += delta; 
z+=(y<<4^y>>5)+ys sum + k[sum>>11 & 3]; 


wl[Ol=y; wI1]=z; 


注意 , 所 有 数组 都 是 无 符号 类 型 , 这 样 我 们 就 可 以 放心 地 进行 位 运算 , 而 不 必 担 心 突然 出 现 负 数 。 
移 位 ( << 和 >> ) 、 异 或 (^ ) 以 及 位 与 (&&) 这 些 位 运算 结合 无 符号 数 加 法 运算 形成 了 完整 的 加 密 算 
法 。 这 段 代码 只 能 用 于 long 的 大 小 是 4 字 节 的 机 器 。 也 就 是 说 , 代码 中 散布 着 “ 磨 数 ”( 即 
sizeof(long) ==4) 。 如 前 所 述 , 这 通常 不 是 一 种 好 的 程序 设计 策略 , 但 这 样 写 程序 , 代码 能 放 在 一 页 
纸 内 。 而 相应 的 数学 公式 也 能 写 在 一 个 信封 的 背面 ,或 者 按照 最 初 的 设想 , 牢 牢 地 记 在 程序 员 的 头 
脑 中 。David Wheeler 最 初 设计 算法 时 , 就 希望 加 密 算 法 如 此 简单 ; 在 他 外 出 旅行 忘 带 笔记 和 便携 式 
电脑 的 情况 下 , 仅 赁 头脑 也 能 回忆 起 算法 , 完成 加 密 操 作 。 除 了 简洁 , 这 段 代 码 还 很 快 。 变 量 n 的 值 
决定 了 循环 次 数 ; 循环 次 数 越 多 , 加 密 强 度 越 高 。 据 我 们 所 知 , 当 n ==32 时 , TEA 尚未 被 攻破 过 。 


下 面 是 解密 枉 数 : 

void decipher( 
const unsigned long * const v 
unsigned long *const w, 
const unsigned long * const k) 


unsigned long y = v[0]; 

unsigned long z = v[1]; 

unsigned long sum = 0xC6EF3720; 

unsigned long delta = 0x9E3779B9; 

unsigned long n = 32; 

/lsum = delta<<5, in general sum = delta* n 

while(n-— > 0) { 
z-=(y<<4^yYy>>5)+yA^Asum + k[sum>>11 & 3]; 
sum -= delita; 
y=-= (z<<4^Z>>5)+ZASum+ksum&a3]， 


} 
w[0]=y; w[1]=z; 
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如 果 文 件 需要 在 不 安全 的 信道 上 传输 , 我 们 可 以 像 下 面 代码 这 样 对 其 加 窗 


int main() /sender 


{ 


const int nchar = 2*sizeof(long); /64 bits 
const int kchar = 2*°nchar; 1 128 bits 


string op; 

string key; 

string infile; 

string outfile; 

cout << "please enter input file name, output file name, and key:\n"; 
cin >> infile >> outfile >> key; 

while (key.size(}<kchar) key += '0 /pad key 

ifstream inf(infile.c_str()); 

ofstream outf(outfile,c_str()); 

if (linf || {outf) error("bad file name"™); 


const unsigned long* k = 
reinterpret_cast<const unsigned long*>(key.datal()); 


unsigned long outptr[2]; 

char inbuffnchar]; 

unsigned long* inptr = reinterpret_cast<unsigned long">(inbuf); 
int count = 0; 


while (inf.get(inbuf{count])) { 

outf<<hex; /use hexadecimal output 

if (++count == nchar) { 
encipher(linptr,outpir,k); 
/pad with leading zeros: 
outf << setw(8) << setfill('0') << outptr[0] << 

<< setw(8) << setfill('0) << outptr[1] << " '; 

count = 0; 


} 


if (count}{ /pad 
while(count != nchar) inbu 作 count++] = "0"; 
encipher(inptr,outptr,k); 
outi << outptr[0] <<" 和 outptr[1] << "} 
; } 
程序 最 重要 的 部 分 是 while 循环 , 剩余 部 分 只 是 起 辅助 作用 。while 循环 读 人 字符 存 到 输入 缓冲 区 
inbuf 中 , 每 次 都 将 8 个 字符 传递 给 encipher( ) 进行 加 密 。TEA 不 关心 传递 给 它 的 字符 , 实际 上 它 
并 不 知道 自己 加 密 的 是 什么 。 例 如 , 你 可 能 在 加 密 一 幅 照 片 或 者 一 次 电话 通话 。TEA 所 关心 的 只 
是 接受 64 位 (两 个 无 符号 long) 明文 , 生成 64 位 密 文 。 因 此 , 我 们 用 一 个 指针 指向 inbuf, 将 其 转 
换 为 unsinged long ”类 型 并 传递 给 TEA。 对 密 钥 也 是 相同 的 处 理 方式 。 由 于 TEA 使 用 128 位 的 密 
钥 (4 个 unsigned long) , 因此 我 们 对 用 户 输入 “ 打 补 丁 ”, 将 其 补 齐 为 128 位 。 最 后 一 条 语句 将 0 
补 在 文本 末尾 , 使 其 位 数 变 为 TEA 所 要 求 的 64 的 整数 倍 (8 个 字 节 ) 。 
密 文 如 何 传输 呢 ? 我 们 可 以 自由 选择 传输 方法 , 但 要 注意 的 是 , 由 于 密 文 是 二 进 制 位 序列 ， 
而 不 是 ASCI 或 Unicode 字符 , 因此 不 能 像 普通 文本 一 样 传输 。 可 以 选择 二 进 制 0 方法 (参见 
11.3.2 六), 不 过 在 本 例 中 我 们 用 十 六 进 制 数 的 形式 输出 密 文 。 
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5b8fb57c 
8ft8111ac 
4cc00fta0 
a5686903 
£1d3£f026 
6al3ef£90 
197d4cd6 
7115211f£ 
44489114 
eeb63c45 
5991ab8b 
55t20835 
7T4a8cfd4 
456fd8a3 
b9ad8e72 
d0l8e6lc 
d7b44fcd 
0602c1a2 
c3f943ed 
£9449784 
14d67edb 
4f21bbbe 
9421d209 
9f2c5a59 
eb9de5a8 
418c24a5 
43c03a51 
5de382c1 


fal68da2 
b5c161f£8 
9ab9bee7 
b8bb87de 
372acli8b 
239efba5 
31167a93 
d5682864 
0dc16bb2 
43295fed 
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806fbcce 
38f3ft2f3 
6£778537 
51Lcc9a61 
b2887412 
td036721 
76874951 
dbe32069 
l8d4f2bc 
82499657 
6aedbb73 
la6d3a4b 
4ce54f5a 
le78591b 
ad30b839 
dic94ea6 
9680425a 
b437c759 
d2cae477 
Qt460350 
11dqa5447 
3d7c5e9b 
2b52384f£ 
ee31f£f147 
95657e30 
de687477 
dl168f£2d1 
1a789445 


60bcl09e 
97f£ff2fc0 
1624516c 
3168a0ftc9 
9a5Qft281 
Sfe3fa6f 
43d17818 
05e641dc 
aS50aalef 
56lde2a0 


2Gb72335 
91108a4bb 
bde7925f£ 
fc19144e 
97580690 
b80035el 
418e8a43 
e4692£87 
256dalibf 
a8265f£44 
71b642c4 
202c36b8 
eSfda09d 
07c8f5a2 
201lfc553 
6ca73314 
72839£71 
ca0e3903 
4d9d0b61 
5d42b06c 
67bc059a 
433564£5 
£f78fbae7 
2ebc3651 
cad37fda 
Sc1b3155 
624c54fe 
aa00178a 
7102ce40 
labf5674 
0d3e556b 
62c01a3Q 
35c9£f8d7 
659d£805 
998ba244 
b5948ec8 
d62eflcd 
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23989Q1Q 
c5el1389f£ 
£87045£0 
d3bcde62 
d2ea4f8b 
7467d8d8 
e9644c2a 
8bft3e33e 
c57b1788 
7T7c866aae 
8d78f68b 
66ale0f£2 
acbdf110 
10164lec 
a34a79c4 
cd60defl 
Q5b6427c 
bd4d8460 
上 647c377 
d4dedb54 
4600£047 
c3ff£f2597 
d03c1lf58 
e017d9d6 
Tbce06f£4 
£f744fbff 
73c99473 
3e583446 
9fed3a0b 
45965600 
6de6eda7 
0a24851 革 
07c8t9b4 
faf4c378 
55dba8ee 
03457e3£ 
£8fbbf67 


991206bc 


64Q7efe8 
472bad6e 
4fdb7dc8 
2d8fb3b7 
d32bb67e 
ebl0e848 
bli8f942c 
9113c372 
7c80a631 
d602bfe4 
771993£3 
259alal9 
d0c9d7e1 
217ca84d 
6e16870e 
214340ft9 
edd0551le 
0d9d303a 
17811b5f 
6384398e3 
3alealdf 
6832680a 
Q6Q60ce2 
457daf44 
26800830 
lbceBfbb 
dcbd64c5 
44245e5d 
D04c0afta 
dl59bl0e 
86365842 
36b6d9a5 
4c2048d6 
799e07e7 
80c934fe 
30c17f£12 


0363a308 
bal33559 
dd228bc3 
43Q565e5 
936cfa6d 
29923fde 
ba67dcd8 
c965b87a 
12662c23 
e9147561 
dleadde7 
11QlLd0ab 
b964a3a9 
60dbebl11l 
30f666c6 
45b94dc0 
8745882£ 
31d34Qd3 
celde974 
4£f7233692 
2e9d15f£7 
305e2713 
207609f£3 
2belf2£9 
eb257206 
92224e9d 
62452495 
dddale73 
£f612ed4c 
b537a770 
71Q5c1a6 
52Gabft4aQ 
a08ae934 
e8bft4939 
43d26aef 
cec5ad4f£f9 
718f4d9a 


试 一 试 ” 如果 密 钥 是 bs, 明文 是 什么 ? 

这 个 程序 还 不 是 很 完美 , 任何 安全 专家 都 会 告诉 你 , 将 明文 和 密 文保 存在 一 起 是 个 笨 主 意 ， 
对 于 打 补 丁 、 密 钥 长 度 为 2 等 问题 也 会 提出 看 法 。 不 过 , 本 书 是 一 本 程序 设计 书籍 , 而 非 计算 机 
安全 书籍 。 

我 们 测试 这 个 程序 的 方法 是 : 读 人 密 文 ， 进行 解密 ， 人 能 进行 简 
单 的 正确 性 测试 总 是 好 的 。 

下 面 是 解密 程序 的 核心 部 分 : 


unsigned long inptr[2]; 

char outbuflnchar+1]; 

outbuf[nchar]=0; /terminator 

unsigned long* outptr = reinterpret_cast<unsigned long*>(outbuf); 
inf.setflios_base::hex ,ios_base: :basefield); // use hexadecimal input 


while (in 人 >>inptr[0]>>inptrI1]) { 
decipher(inptroutptrfo; 
outf<<outbuf; 


} 
注意 这 条 语句 : 
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inf.setf(ios_base::hex ,ios_base::basefield); 

它 读 和 十 六 进 制 数 。 对 于 解密 程序 而 言 ， 这 些 数据 保存 在 输出 缓冲 区 outbuf 中 , 进行 类 型 转换 后 
作为 二 进 制 位 进行 处 理 。 

TEA 这 个 例子 属于 谍 和 人 式 系统 程序 设计 范畴 吗 ? 这 不 太 明 确 , 但 你 可 以 想象 它 被 用 于 安全 系 
统 或 金融 业务 系统 , 这 些 应 用 都 是 由 很 多 "小 设备 "组 成 的 。 无 论 如 何 ，TEA 程序 展示 了 很 多 好 的 
艇 人 式 程 序 设 计 方 法 : 它 基 于 一 个 清晰 的 (数学 ) 模 型 , 能 确保 其 正确 性 , 它 很 简洁 、 很 快速 而 且 
直接 依赖 于 硬件 特性 。encipher( ) 和 decipher( ) 的 接口 风格 并 不 很 符合 我 们 的 习惯 。 但 是 , 它们 
不 仅 用 C++ 实现 , 还 用 C 实现 ,因此 不 能 使 用 C 语言 不 支持 的 C++ 特 性。 另外 , 程序 中 出 现 的 
很 多 “ 魔 数 " 都 直接 来 自 于 数学 模型 。 


25.6 编码 规范 


错误 的 源头 是 多 种 多 样 的 。 最 严重 、 最 难以 修正 的 错误 都 是 与 上 层 设计 决策 相关 的 , 这 些 设 
计 决 策 包 括 总 体 的 错误 处 理 策略 、 遵 循 (或 不 遵循 ) 特 定 的 标准 、 算 法 设计 、 数 据 表示 方式 等 。 这 
些 问 题 已 经 超出 了 本 书 的 讨论 范围 , 我 们 讨论 的 重点 是 那些 由 于 糟糕 的 程序 设计 方式 而 导致 的 错 
误 。“ 糟 糕 的 程序 设计 方式 ”主要 是 指使 用 语言 特性 的 方式 容易 引起 错误 , 或 者 表达 思想 的 方式 模 
糊 不 清 。 

编码 规范 试图 解决 后 一 类 问题 , 它 定 义 一 个 “排版 风格 ”来 为 程序 员 指 引 方 向 : 对 于 特定 应 
用 , 使 用 哪些 C++ 语言 特性 比较 恰当 。 例 如 ,嵌入 式 程序 设计 编码 规范 可 能 会 禁止 使 用 new。 通 
常 , 编码 规范 还 会 尽力 令 不 同 程序 员 编 写 出 的 代码 更 为 相似 , 虽然 他 们 可 以 自由 选择 程序 设计 风 
格 。 例 如 , 某 个 编码 规范 可 能 会 要 求 循环 结构 都 用 for 语句 实现 ( 即 禁止 while 语句 ) 。 这 能 使 代码 
更 一 致 , 在 开发 大 型 项 目 时 , 这 对 代码 维护 有 着 重要 作用 。 请 注意 , 一 种 编码 规范 只 针对 一 类 特 
定 的 程序 设计 ， 只 为 某 些 特 定 的 程序 员 提 供 帮助 。 不 存在 一 种 适合 于 所 有 C++ 应 用 和 所 有 C++ 
程序 员 的 编码 规范 。 

编码 规范 试图 解决 的 是 解决 方案 表达 方式 方面 的 问题 ， 而 不 是 应 用 的 复杂 性 方面 的 问题 。 因 
此 , 我 们 可 以 说 , 编码 规范 试图 解决 偶然 复杂 性 , 而 不 是 必然 复杂 性 。 

引起 偶然 复杂 性 的 主要 原因 包括 : 

。 过 于 聪明 的 程序 员 , 他 们 在 表达 复杂 解决 方案 时 试图 使 用 那些 并 不 理解 或 并 不 喜欢 的 语 
言 特性 。 
未 经 良好 培训 的 程序 员 , 不 会 使 用 最 适合 的 语言 特性 和 库 功能 。 
不 必要 的 程序 设计 风格 变化 , 这 会 导致 完成 相似 工作 的 代码 在 形式 上 差异 很 大 , 给 代码 维 
护 人 员 带 来 困扰 。 
不 恰当 的 程序 设计 语言 , 这 会 导致 所 使 用 的 语言 特性 非常 不 适合 于 某 些 应 用 领域 或 某 些 
程序 员 。 

。 没有 有 效 利用 库 ， 导 致 程序 中 存在 大 量 专门 处 理 低 层 资 源 的 代码 。 

。 不 恰当 的 编码 规范 , 导致 解决 某 些 问题 时 , 付出 额外 的 工作 量 或 者 无 法 采用 最 优 的 解决 方 

案 , 从 而 引起 一 些 棘 手 的 问题 。 

25. 6. 1 编码 规范 应 该 是 怎样 的 

一 个 好 的 编码 规范 应 该 能 帮助 程序 员 写 出 好 的 代码 , 即 对 于 一 些小 的 程序 设计 问题 能 够 直接 
给 出 答案 ， 而 无 需 程序 员 花费 时 间 逐 个 解决 。 有 一 句 在 工程 师 间 流传 很 久 的 格言 :“ 形 式 即 解 
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放 ”。 理 想 情况 下 , 编码 规范 应 该 是 指示 性 的 , 指出 应 该 做 什么 。 看 起 来 显然 应 该 这 样 , 但 很 多 编 
码 规范 只 是 简单 罗列 了 不 能 做 什么 ,而 没有 指明 应 该 做 什么 。 仅 仅 告 诉 程序 员 什么 不 能 做 不 会 对 
编程 有 什么 帮助 , 而 且 常 常会 令 人 很 恼火 。 

好 的 编码 规范 中 的 原则 应 该 都 是 可 验证 的 , 最 好 可 以 通过 程序 来 验证 。 也 就 是 说 ， 当 我 们 写 
完 程序 后 , 查看 一 下 代码 就 可 以 很 容易 地 回答 这 个 问题 :“ 我 是 否 违 反 了 编码 原则 ?” 

对 于 列 出 的 编码 原则 , 一 个 好 的 编码 规范 应 该 解释 清楚 其 理论 依据 。 不 能 只 是 对 程序 员 说 : 
“我 们 就 是 这 样 做 的 1”, 这 只 会 增加 程序 员 的 厌恶 感 。 更 糟 的 是 ， 如 果 程 序 员 觉 得 规范 的 某 些 部 
分 毫 无 益处 ,甚至 妨碍 他 们 写 出 高 质量 的 程序 ， 就 会 不 停 地 尝试 推翻 它 。 不 要 期 待 编码 规范 的 全 
部 内 容 都 受到 欢迎 。 即 使 是 最 好 的 编码 规范 也 都 是 一 定 程度 上 的 折衷 ,而 且 大 多 数 “ 不 该 做 "都 会 
引起 问题 ,即便 你 自己 没 碰 到 。 例 如 , 不 一 致 的 命名 规范 是 混乱 之 源 , 但 不 同人 都 有 自己 特别 偏 
好 的 命名 规范 , 而 强烈 抵触 其 他 规范 。 例 如 , 我 个 人 认为 首 字母 大 写 的 标识 符 命 名 法 (如 Camel- 
CodingStyle)“ 非 常 丑陋 ”, 强烈 倾向 于 “ 下划线 风格 ”( 如 underscore_style) ， 认 为 这 种 风格 更 清晰 、 
本 质 上 更 易 读 , 很 多 人 也 赞同 我 的 观点 。 但 男 一 方面 , 也 有 很 多 人 并 不 赞同 这 一 观点 。 显 然 ,， 没 
有 任何 一 种 命名 规范 能 满足 所 有 人 , 但 多 数 情 况 下 , 一 个 一 致 风格 绝对 比 没有 规范 更 好 。 

关于 编码 规范 应 该 是 怎样 的 , 我 们 总 结 如 下 : 

。 一 个 好 的 编码 规范 应 该 针对 特定 应 用 领域 和 特定 程序 员 设 计 。 

e 一 个 好 的 编码 规范 应 该 既 有 指示 性 , 又 有 限制 性 。 
ma 推荐 一 些 “ 基础 的 ” 库 功能 作为 指示 性 原则 , 通常 是 最 有 效 的 方式 。 

一 个 编码 规范 就 是 一 个 编码 原则 集合 , 指明 了 程序 风格 。 
a 通常 应 该 指定 命名 和 缩 进 原则 : 如 “使 用 “ Stroustrup 布局 风格 一 
s 通常 应 该 指定 允许 使 用 的 语言 子 集 : 如 “不 要 使 用 new 或 hrow” 。 o 
a 通常 应 该 指定 注释 原则 : 如 “每 个 函数 应 该 用 一 段 注释 描述 其 功能 ”。 
se 通常 应 该 指明 使 用 哪些 库 : 如 “使 用 < iostream > 而 不 是 < stdio. h > ”或 “使 用 vector 和 
string 而 不 是 内 置 数组 和 C 风格 字符 串 ”。 
e。 大 多 数 编码 规范 的 共同 目标 是 提高 程序 的 
a 可 靠 性 
sa 可 移植 性 
a 可 维护 性 
sa 可 测试 性 
s 重用 性 
a 可 扩展 性 
a 可 读 性 
一 个 好 的 编码 规范 要 比 没有 规范 更 好 。 如 果 没 有 编码 规范 , 就 不 应 该 启动 一 个 大 型 (需要 
很 多 人 ,多 年 才能 完成 ) 的 工业 项 目 。 
一 个 糟糕 的 编码 规范 甚至 比 没有 规范 更 糟 。 例 如 , 一 个 限制 使 用 C 语言 子 集 的 C++ 编程 
规范 是 有 害 的 。 但 不 幸 的 是 , 糟糕 的 编码 规范 并 不 罕见 。 
e 任何 一 个 编码 规范 ,即便 是 好 的 编码 规范 ,也 都 会 有 程序 员 不 吾 欢 。 大 多 数 程 序 员 希 望 按 
自己 喜欢 的 方式 编写 代码 。 
25. 6.2 编码 原则 实例 
下 面 , 我 们 会 给 你 列 出 一 些 编码 规范 中 的 编码 原则 。 自 然 , 我 们 之 所 以 选择 这 些 原 则 , 就 是 
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希望 它们 能 对 你 有 所 帮助 。 但 是 , 我 们 所 见 过 的 实际 的 编码 规范 还 没有 少 于 35 页 的 , 大 多 数 还 要 
长 得 多 。 所 以 , 在 本 节 中 我 们 不 会 给 出 一 个 完整 的 编码 规范 。 而 且 ， 如 前 所 述 , 任何 好 的 编码 规 
范 都 是 为 特定 应 用 领域 和 特定 程序 员 所 设计 的 。 因 此 , 我 们 不 会 伪 称 这 些 编码 原则 是 通用 的 。 

我 们 为 编码 原则 编 了 号 , 并 为 每 条 原则 给 出 了 简短 的 设计 依据 。 为 了 帮助 理解 ,很 多 原则 都 
附带 了 一 些 例子 。 我 们 将 编码 原则 分 为 推荐 规则 (recommendation) 和 严格 规则 (firm rule) 两 类 , 对 
于 前 者 , 程序 员 偶 尔 可 以 不 遵守 , 而 后 者 则 必须 严格 遵守 。 对 于 现实 中 的 编码 规范 ， 只 有 管理 者 
才能 授权 修改 严格 规则 。 如 果 你 在 程序 中 违反 了 推荐 规则 或 者 严格 规则 , 应 该 通过 注释 来 说 明 原 
因 。 在 规范 中 , 原则 的 例外 情况 也 可 与 原则 一 并 列 出 。 本 节 中 给 出 的 每 条 严格 原则 都 用 一 个 大 写 
字母 R 及 其 编号 标识 , 而 推荐 原则 都 用 小 写字 母 r 及 其 编号 标识 。 

我 们 将 编码 原则 分 类 如 下 : 

。 一 般 原则 

。 预 处 理 原则 

。 命名 和 布局 原则 

。 类 原则 

。 函数 和 表达 式 原则 

。 硬 实时 原则 

。 关键 系统 原则 

“ 硬 实时 ”和 “关键 系统 ”原则 仅 用 于 硬 实时 和 关键 系统 程序 设计 。 

与 一 个 好 的 实际 编码 规范 相 比 , 我 们 使 用 的 有 些 术语 并 不 明确 (如 “关键 ”的 确切 含义 是 什 
么 ) ， 而 列 出 的 原则 也 有 些 过 于 人 简单。 你 会 发 现 它 们 与 JSE++ 原则 (参见 25. 6.3 节 ) 有 相似 之 处 ， 
这 并 不 是 偶然 的 , 我 本 人 参与 了 JSF ++ 原则 的 规划 。 不 过 , 本 书 中 的 代码 实例 并 未 遵循 本 节 中 给 
出 的 编码 原则 , 毕竟 , 本 书 中 的 程序 并 不 是 为 关键 的 和 庶 人 式 系 统 所 编写 的 。 

一 般 原则 

R100: 任何 函数 和 类 的 代码 规模 都 不 应 超过 200 行 (不 包括 注释 )。 

原因 : 长 的 函数 和 类 会 更 复杂 , 因而 难于 理解 和 测试 。 

rl01: 任何 函数 和 类 都 应 该 能 完全 显示 在 一 屏 上 ,并 完成 单一 的 逻辑 功能 。 

原因 : 如 果 程 序 员 只 能 看 到 函数 或 类 的 一 部 分 , 就 很 可 能 漏 掉 有 错误 的 部 分 。 如 果 一 个 函数 
试图 完成 多 个 功能 , 与 单 功能 的 函数 相 比 ,其 规模 就 可 能 很 大 , 而且 会 更 复杂 。 

R102. 所 有 代码 都 应 该 遵循 ISO/IEC 14882: 2003(E) C++ 标准 。 

原因 : 在 ISOZIEC 14882 标准 之 上 的 扩展 和 变形 可 能 会 不 稳定 , 定义 不 明确 , 而 且 可 能 影响 可 
移植 性 。 

预 处 理 原 则 

R200 : 除了 用 于 源码 控制 的 机 fdef 和 #ifndef 之 外 ,不 要 使 用 宏 。 

原因 : 宏 不 遵守 定义 域 和 类 型 规则 , 而 且 使 代码 变 得 更 不 清晰 、 不 易 读 。 

R201 : #include 只 能 用 于 包含 头 文件 (“.h) 。 

原因 : 区 nclude 用 于 访问 接口 的 声明 而 非 实 现 细 节 。 

R202 : 所 有 区 nclude 语句 都 应 位 于 任何 非 预 处 理 声明 之 前 。 

原因 : 如 果 #include 语句 位 于 程序 中 间 , 就 很 可 能 被 阅读 程序 的 人 忽略 , 而 且 容 易 导 致 程序 不 
同 部 分 对 名 字 的 解析 不 一 致 。 
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R203 : 头 文件 (”. h) 不 应 包含 非常 量变 量 的 定义 或 非 内 联 、 非 模板 水 数 定义 。 

”原因 : 头 文 件 应 该 包含 接口 声明 而 非 实现 细节 。 但 是 , 常量 通常 被 看 做 接口 的 一 部 分 ; 出 于 
性 能 的 考虑 , 一 些 非 常 简单 的 函数 应 该 作为 内 联 函 数 (因此 应 该 放 在 头 文件 中 ) ; 而 当前 的 编译 器 
要 求 完整 的 模板 定义 都 放 在 头 文 件 中 。 

命名 和 布局 原则 

R300: 应 该 使 用 缩 进 , 并 且 在 一 个 源码 文件 中 缩 进 风 格 应 该 一 致 。 
原因 : 可 读 性 和 代码 风格 。 

R301: 每 条 新 语句 都 男 起 一 行 。 

原因 : 可 读 性 。 

例子 : 

inta =7; x =a+7; f(x,9); HA violation 

inta=7; //OK 


X=a+7; /OK 
f(x,9); /OK 


例子 : 
if (p<q) cout << *p; - H violation 
例子 : 


if (p<q) 
cout<<*p; /OK 


R302 : 标识 符 的 名 字 应 该 都 具有 描述 性 。 
标识 符 可 以 包含 常见 的 缩写 和 字 头 缩 略 。 
如 果 x、y、i、j 等 是 按 习惯 方式 使 用 , 可 以 认为 是 有 描述 性 的 。 
使 用 下 划 线 风格 (number_of_elements) 而 不 是 字 头 缩 略 风格 (numberOfElements ) 。 
不 要 用 匈牙利 命名 法 。 
类 型 、 模 板 和 名 字 空 间 的 命名 都 以 大 写字 母 开 头 。 
避免 过 长 的 名 字 。 

例子 : Device_driver 和 Buffer_pool。 

原因 : 可 读 性 。 

注意 : C++ 标准 规定 ,以 下 划 线 开头 的 标识 符 留 作 语 言 实 现 所 用 , 因此 在 用 户 程序 中 应 被 

荣 止 6 

例外 : 调用 经 过 认证 的 库 , 来 自 库 中 的 名 字 是 可 以 使 用 的 。 

例外 : 宏 名 用 于 保护 机 nclude 不 被 重复 包含 。 

R303: 标识 符 不 能 只 在 以 下 方面 不 同 : 

。 大 小 写 不 同 

。 只 相差 下 划 线 

。 只 是 字母 0、 数 字 0 或 字母 D 间 的 蔡 换 

。 只 是 字母 1 数字 1 或 字母 1 之 间 的 蔡 换 

。 只 是 字母 S 和 数字 5 之 间 的 替换 

。 只 是 字母 Z 和 数字 2 之 间 的 替换 

。 只 是 字母 ” 和 字母 h 之 间 的 蔡 换 

例子 : Head 和 head // 违反 了 原则 。 
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原因 : 可 读 性 。 

R304; 标识 符 不 能 只 包含 大 写字 母 和 下 划 线 。 

例子 : BLUE 和 BLUE_CHEESE // 违反 了 原则 。 

原因 : 全 部 大 写字 母 的 标识 符 被 广泛 用 于 宏 名 , 可 能 用 于 经 过 认证 的 库 中 的 丰 nclude 文件 , 而 
不 应 该 用 于 用 户 程序 。 

国 数 和 表达 式 原 则 

r400: 内 层 循环 的 标识 符 和 外 层 循 环 的 标识 符 不 应 重 名 。 

原因 ; 可 读 性 和 代码 风格 。 

例子 : 

int var = 9; { int var = 7; ++var; } /violation: var hides var 

R401: 声明 的 作用 域 应 该 尽量 小 。 

原因 : 保持 变量 的 初始 化 和 使 用 尽量 靠近 , 以 降低 混乱 的 可 能 性 ; 令 离开 作用 域 的 变量 释放 


其 资源 。 
R402: 所 有 变量 都 要 初始 化 。 
例子 : 
int var; i violation: var is not initialized 


原因 : 未 初始 化 的 变量 通常 是 错误 之 源 。 

例外 : 如 果 数 组 或 容器 会 立即 从 输入 接收 数据 , 则 不 必 初 始 化 。 

R403 : 不 应 使 用 类 型 转换 。 

原因 : 类 型 转换 是 错误 之 源 。 

例外 : dynamic_cast 可 以 使 用 。 

例外 : 新 风格 的 类 型 转换 可 以 使 用 , 用 来 将 硬件 地 址 转换 为 指针 , 或 者 将 从 程序 外 部 (如 GUI 
库 ) 获 取 的 void 转换 为 恰当 类 型 的 指针 。 

R404 : 函数 接口 中 不 应 使 用 内 置 数组 类 型 ， 即 如 果 一 个 函数 参数 是 指针 , 那么 它 必须 指向 单 
个 元 素 。 如 果 希 望 传递 数组 , 应 使 用 Array_ref。 

原因 : 数组 只 能 以 指针 方式 传递 , 而 元 素数 目 无 法 附着 其 上 , 只 能 分 开 传 递 。 而 且 , 隐 式 的 
数组 到 指针 的 转换 和 派生 类 到 基 类 的 转换 会 引起 内 存 错误 。 

类 原则 

Rs00: 对 于 没有 共有 数据 成 员 的 类 , 用 class 声明 。 对 没有 私有 数据 成 员 的 类 , 用 struct 声明 。 
不 要 定义 既 有 共有 数据 成 员 ， 又 有 私有 数据 成 员 的 类 。 

原因 : 清晰 性 。 

rs01: 如 果 类 包含 析 构 孙 数 或 者 指针 /引用 类 型 的 成 员 , 必须 为 其 定义 或 禁止 ( 即 不 能 使 用 默 
认 的 ) 拷 贝 构造 函数 和 拷贝 赋值 运算 符 。 

原因 : 析 构 函数 通常 会 释放 资源 。 对 于 具有 析 构 函数 或 指针 和 引用 类 型 的 类 , 默认 拷贝 语义 
几乎 不 可 能 "做 正确 的 事 ”。 

RSs02 : 如 果 类 包含 虚 函 数 , 那么 它 必 须 具 有 虚 析 构 函 数 。 

原因 : 虚 函 数 可 以 通过 基 类 接口 来 使 用 , 通过 基 类 接口 访问 对 象 的 函数 可 能 会 删除 对 象 , 派 
生 类 必须 有 某 种 机 制 ( 析 构 函数 ) 来 进行 清理 工作 。 

rs03 : 接受 单一 参数 的 构造 函数 必须 显 式 声明 。 
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原因 : 避免 奇怪 的 隐 式 类 型 转换 。 

硬 实时 原则 

原因 : 异常 不 可 预测 。 

R801 : new 只 能 在 初始 化 时 使 用 。 

原因 : 不 可 预测 。 

例外 : 可 以 用 定 址 的 new 从 栈 中 分 配 内 存 。 
R802 : 不 应 使 用 delete。 

原因 : 不 可 预测 , 可 能 会 引起 碎片 问题 。 
R803 : 不 应 使 用 dynamic_cast。 

原因 : 不 可 预测 (假定 是 用 普通 方法 实现 的 ) 。 
R804 : 不 应 使 用 标准 库容 器 ， std : : array 除外 。 
原因 : 不 可 预测 (假定 是 用 普通 方法 实现 的 ) 。 


关键 系统 原则 

R900 : 递增 和 递减 运算 不 能 作为 子 表达 式 。 
例子 : 

intx=v[I++i]j; //violation 

例子 : 

和 = v[i]; /OK 


原因 : 可 能 会 被 漏 掉 。 
R901: 代码 不 应 依赖 于 算术 表达 式 优先 级 之 下 的 优先 级 规则 。 
例子 : 


x=a*btc; /OK 
例子 : 
ia<b || c<=d) /violation: parenthesize (a<b) and (c<=d) 
原因 : CAC++ 基础 较 差 的 程序 员 写 出 的 代码 中 常常 会 有 优先 级 混乱 的 情况 。 
上 面 列 出 的 编码 原则 并 未 按 顺 序 编号 , 这 样 可 以 随时 加 入 新 的 原则 , 而 不 必 更 改 已 有 的 编号 , 也 
不 会 破坏 分 类 。 编 码 原则 常常 以 编号 被 人 熟知 , 改变 这 些 编号 会 受到 用 户 的 反对 。 
25. 6. 3 ”实际 编码 规范 
已 经 有 很 多 C++ 编码 规范 ,大 多 数 是 公司 所 有 , 并 未 广泛 使 用 。 在 很 多 情况 下 , 这 对 程序 员 
来 说 可 能 是 好 事 , 也 许 只 有 这 些 公司 的 程序 员 除 外 。 下 面 列 出 了 一 些 对 程序 设计 有 帮助 的 编码 规 
范 , 当然 前 提 是 将 它们 应 用 在 恰当 的 领域 : 
Henricson, Mats, and Erik Nyquist. Industrial Strength C++: Rules and Recommendations. Pren- 
tice Hall, 1996. ISBN 0131209655. 这 是 一 个 电信 公司 编制 的 规范 。 不 辛 的 是 , 其 中 的 编 
码 原则 有 些 过 时 了 ， 因 为 这 本 书 的 出 版 日 期 早 于 ISO C++ 标 准 , 特别 是 它 没有 将 模板 纳 
入 讨论 范围 。 以 现在 的 眼光 来 看 , 这 本 书 中 的 编码 原则 都 应 该 重 写 了 。 
Lockheed Martin Corporation. “ Joint Strike Fighter Air Vehicle Coding Standards for the System 
Development and Demonstration Program. ”文档 编号 2RDU00001 Rev C. 2005 年 12 月 。 俗 
称 “JSF ++”, 这 是 洛克 希 德 - 蕊 丁 航 空 公司 为 飞机 软件 所 编制 的 规范 。 编 制 和 使 用 这 个 规范 
的 人 , 是 那些 正在 编写 人 类 生活 必 不 可 少 的 软件 的 程序 员 。 请 参考 www. research att cor ~ 
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bs/ JSF-AV-rules. pdf。 
Programming Research. High-integrity C++ Coding Standard Manual 2.4 版 。 请 参考 www. programmin- 
gresearch. como 
Sutter, Herb, and Andrei Alexandrescu. C++ Coding Standards: 101 Rules, Guide-lines, and Best 
Practices. Addison-Wesley, 2004. ISBN 0321113586。 本 书 很 大 程度 上 可 以 看 做 “元 编码 规 
范 ， 即 它 并 不 是 定义 特定 的 编码 原则 ， 而 是 为 设计 原则 指出 方向 : 什么 是 好 的 原则 及 为 
y 
注意 , 并 不 是 说 阅读 了 以 上 书籍 ,你 就 不 必 再 去 了 解 实际 的 应 用 领域 、 程 序 设计 语言 以 及 相 
关 的 程序 设计 技术 了 。 对 于 大 多 数 应 用 领域 ,当然 也 包括 区 入 式 程 序 设计 , 你 还 是 需要 了 解 操作 
系统 和 硬件 体系 结构 。 如 果 你 需要 使 用 C++ 进行 低层 程序 设计 ,请 查阅 ISO C++ 委员 会 关于 性 
能 的 报告 (ISO/IEC TR 18015 ，www. research. att. com/ ~ bs/performanceTR. pdf)。 提 及 “性 能 , 他 
们 /我 们 主要 是 指 “ 骨 入 式 程序 设计 ”。 
语言 方言 和 专 有 语言 在 散人 入 式 领域 是 很 常见 的 , 但 只 要 条 件 人 允许 , 请 使 用 标准 语言 (如 ISO 
C++ )、 标 准 工具 和 标准 库 。 这 会 使 你 的 学 习 曲 线 更 短 , 而 且 可 能 延长 你 的 工作 成 果 的 寿命 。 


人 简单 练习 
1 编译 、 运 行 下 面 的 程序 : 


intv=1; for (inti = 0; i<sizeof(v)*8; ++i) { cout <<v <<' ;Vv<<=1;} 
2. 将 v 改 为 unsigned int 类 型 , 重新 编译 、 运 行程 序 
3. 使 用 十 六 进 制 常量 定义 short unsigned int 变量 , 使 其 值 : 
a) 所 有 位 都 置 位 ( 置 为 1)。 
b) 最 低 有 效 位 置 位 。 
c) 最 高 有 效 位 置 位 。 
d) 最 低 字 节 所 有 位 都 置 位 。 
e) 最 高 字 节 所 有 位 都 置 位 。 
f) 每 隔 一 位 置 位 (最 低 有 效 位 置 为 1 )。 
g) 每 隔 一 位 置 位 (最 低 有 效 位 置 为 0)。 
4. 将 上 题 中 每 个 数 以 十 进 制 形 式 和 十 六 进 制 形式 输出 。 
5. 用 位 运算 (1、&、<< ), 只 用 常量 1 和 0, 重 做 第 3、4 题 。 
全 》 思 考题 
. 什么 是 般 入 式 系 统 ? 给 出 十 个 例子 , 至 少 有 三 个 是 本 章 未 提 及 的 。 
. 和 蔷 和 人 式 系统 的 特殊 之 处 在 哪里 ? 给 出 常见 的 五 点 。 
. 给 出 艇 入 式 系统 中 可 预测 性 的 定义 ? 
. 为 什么 髋 入 式 系 统 的 维修 很 困难 ? 
.为 什么 出 于 性 能 的 考虑 进行 系统 优化 是 个 糟糕 的 主意 ? 
.为 什么 我 们 更 倾向 于 使 用 高 层 抽 象 而 不 是 低层 代码 ? 
. 什么 是 瞬时 错误 ?为 什么 我 们 特别 害怕 这 种 错误 ? 
. 如 何 设计 具有 故障 恢复 能 力 的 系统 ? 
. 为 什么 我 们 无 法 防止 所 有 故障 ? 
10. 什么 是 领域 知识 ? 给 出 一 些 应 用 领域 的 例子 。 
11. 为 什么 对 于 般 入 式 系统 程序 设计 来 说 领域 知识 是 必要 的 ? 
12. 什么 是 子 系统 ? 给 出 一 些 例 子 。 
13. 从 C++ 语言 的 角度 , 存储 可 以 分 为 哪 三 类 ? 
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. 什么 情况 下 你 会 使 用 动态 内 存 分 配 ? 

.为 什么 在 此 人 式 系 统 中 使 用 动态 内 存 分 配 通 常 是 不 可 行 的 ? 
.什么 情况 下 在 能 和 人 式 系 统 中 使 用 new 是 安全 的 ? 

. 在 苦 人 式 系统 中 使 用 std :: vector 的 潜在 问题 是 什么 ? 

. 在 风 人 式 系统 中 使 用 异常 的 潜在 问题 是 什么 ? 

. 什么 是 递归 函数 调用 ? 为 什么 一 些 拱 人 式 系 统 程序 员 要 避 开 它 ? 替代 方法 是 什么 ? 
. 什么 是 内 存 碎 片 ? 

. 什么 是 垃圾 收集 器 (在 程序 设计 中 )? 

.什么 是 内 存 泄漏 ? 它 为 什么 会 导致 错误 ? 

. 什么 是 资源 ? 请 举例 。 

. 什么 是 资源 泄漏 ? 如 何 系统 地 预防 ? 

. 为 什么 不 能 将 对 象 从 一 个 内 存 位 置 简单 地 移动 到 为 一 个 位 置 ? 
. 什么 是 栈 ? 

. 什么 是 存储 池 ? 

. 为 什么 栈 和 存储 池 不 会 导致 内 存 碎 片 ? 

. 为 什么 reinterpret_cast 是 必要 的 ? 它 又 会 导致 什么 问题 ? 

.指针 作为 函数 参数 有 什么 危险 ? 请 举例 。 

.指针 和 数组 可 能 引起 什么 问题 ? 请 举例 。 

. 在 函数 接口 中 , 可 以 用 什么 机 制 奉 代 ( 指 向 数组 的 ) 指 针 人 参数 ? 
.“ 计 算 机 科学 第 一 定律 "是 什么 ? 

. 位 是 什么 ? 

. 字 节 是 什么 ? 

.通常 一 个 字 节 有 多 少 位 ? 

. 位 运算 有 哪些 ? 

. 什么 是 “ 异 或 ”运算 ? 它 有 什么 用 处 ? 

.如何 描述 位 序列 ? 

. 字 中 位 的 习惯 编号 次 序 是 怎样 的 ? 

. 字 中 字 节 的 习惯 编号 次 序 是 怎样 的 ? 

. 什么 是 字 ? 

. 通常 一 个 字 中 有 多 少 位 ? 

. 0xf7 的 十 进 制 值 是 多 少 ? 

.0xab 的 位 序列 是 什么 ? 

.bitset 是 什么 ? 你 什么 情况 下 需要 使 用 它 ? 

unsigned int 和 signed int 的 区 别 是 什么 ? 

， 什 么 时 候 使 用 unsigned int 比 signed int 更 好 ? 

， 如 果 需 要 处 理 的 元 素数 目 非 常 巨 大 ,如 何 设 计 一 个 循环 ? 

.如 果 将 -3 赋予 一 个 unsigned int 变量 , 它 的 值 会 是 什么 ? 

. 我 们 为 什么 要 直接 处 理 位 和 字 节 (而 不 是 处 理 上 层 数据 类 型 )? 
. 什么 是 位 域 ? 

. 位 域 的 用 途 是 什么 ? 

.加密 是 什么 ? 为 什么 要 加 密 ? 

. 能 对 照片 进行 加 蜜 吗 ? 

. TEA 表示 什么 ? 

.如 何以 十 六 进 制 输出 一 个 数 ? 

. 编码 规范 的 目的 是 什么 ? 列 出 几 条 需要 编码 规范 的 原因 。 
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: 为 什么 没有 一 个 普 适 的 编码 规范 ? 

. 列 出 一 些 好 的 编码 规范 应 该 具备 的 特点 。 

. 编码 规范 如 何 会 起 到 不 好 的 效果 ? z 
. 列 出 至 少 十 条 你 认可 (发 现 有 用 ) 的 编码 规范 。 解 释 它们 为 什么 有 用 。 
.我 们 为 什么 要 避免 使 用 字母 全 部 大 写 的 标识 符 ? 


必 》 术 语 

地 址 加 密 存储 池 位 ”” 异 或 

可 预测 性 位 域 小 设备 实时 bitset 

垃圾 收集 器 资源 编码 规范 硬 实时 软 实时 
散 入 式 系统 汇 汤 unsigned 

<》 习题 


1. 
2 


如 果 你 还 没有 做 本 章 中 的 “ 试 一 试 " 练习 , 现在 做 一 下 。 

为 0 ~9 的 数字 创建 一 个 对 应 单词 表 , 使 得 所 有 十 六 进 制 数字 都 能 用 英文 字母 ( 串 ) 表示。 如 用 。 表示 0， 
用 1 表示 1, 用 to 表示 2, 等 等 。 这 样 , 十 六 进 制 数 能 够 拼 成 像 单 词 的 形式 ， 如 0xF001 拼写 为 Fool， 
0xBEEF 拼写 为 Beef。 在 提交 之 前 , 小 心地 去 除 单词 表 中 的 粗话 。 


. 用 以 下 位 模式 初始 化 一 个 32 位 有 符号 整数 , 并 打印 出 结果 : 全 0、 全 1、1 和 0 交替 (最 高 有 效 位 为 1) 、0 


和 1 交替 (最 高 有 效 位 为 0)、 两 个 1 和 两 个 0 交替 (110011001100…)、 两 个 0 和 两 个 1 交替 
《001100110011…)、 全 1 工 字 节 和 全 0 字 届 交替 (最 高 字 市 为 全 1)、 全 0 字 节 和 全 1 字 节 交替 (最 高 字 节 为 
全 0)。 对 32 位 无 符号 数 重 做 本 题 。 


. 为 第 7 章 的 计算 器 程序 添加 位 运算 &、1、^ 和 ~。 
.编写 一 个 无 限 牧 环 , 观察 执行 效果 。 


6 编写 一 个 不 易 察 党 的 无 限 循环 。 如 果 设 计 出 的 循环 未 能 无 限 执行 下 去 只 是 因为 耗 尽 了 某 种 系统 资源 ,也 


可 认为 达到 了 本 题 的 要 求 。 


. 输出 0 ~400 这 些 数值 的 十 六 进 制 形式 , 输出 -200 到 200 这 些 数值 的 十 六 进 制 形式 。 


8. 输出 你 的 键盘 上 的 每 个 字符 的 数值 。 


‘DO 


. 不 使 用 任何 标准 头 文件 (如 <limits > ), 也 不 借助 任何 文档 , 计算 在 你 的 系统 中 , 一 个 int 包含 多 少 位 , 并 


确定 char 是 有 符号 的 还 是 无 符号 的 。 


10. 仔细 分 析 25. 5. 5 节 中 关于 位 域 的 例子 程序 。 编 写 程序 , 初始 化 一 个 PPN, 然后 读 取 并 输出 每 个 位 域 的 


1 1. 
12. 
13. 
14. 


15. 


16. 


值 , 接着 改变 每 个 位 域 的 值 ( 可 以 向 每 个 位 域 赋值 ) 并 输出 结果 。 改 用 一 个 32 位 无 符号 数 存 储 PPN, 并 
使 用 位 运算 (参见 25. 5.4 节 ) 访 问 每 个 域 , 重 做 此 题 。 

重 做 上 题 , 将 二 进 制 位 保存 在 bitset <32 > 中 。 

对 25.5.6 节 中 的 例子 , 解密 密 文 , 输出 明文 。 

利用 TEA( 人 参见 25. 5.6 节 ) 实现 两 台 计算 机 之 间 的 “保密 通信。 最低 限度 要 实现 安全 的 了 -mail。 
实现 一 个 简单 vector, 能 保存 至 多 NN 个 元 素 , 存储 空间 从 一 个 存储 池 中 分 配 。 测 试 N==1000, 元 素 类 型 
为 整数 的 情况 。 

测试 用 new 分 配 10 000 个 对 象 所 花费 的 时 间 ( 参 见 26. 6. 1 节 )，, 对 象 大 小 为 1 字 节 到 1000 字 节 之 间 的 随 
机 值 , 然后 测试 用 delete 释放 这 些 对 象 所 花费 的 时 间 。 测 试 两 次 , 第 一 次 按 分 配 的 逆序 进行 释放 , 第 二 
次 按 随机 顺序 进行 释放 。 然 后 , 测试 从 存储 池 中 分 配 10 000 个 大 小 固定 为 500 字 节 的 对 象 的 时 间 和 条 
放 它 们 的 时 间 。 接 着 测试 从 栈 中 分 配 10 000 个 大 小 为 1 字 节 到 1000 字 节 之 间 随 机 数 的 对 象 的 时 间 和 首 
序 释放 它们 的 时 间 。 比 较 测试 结果 。 每 个 测试 至 少 重复 3 次 以 确保 结果 是 一 致 的 。 

给 出 20 条 编码 风格 方面 的 原则 (不 要 简单 地 复制 25.6 节 中 的 内 容 )。 将 这 些 原则 应 用 到 你 最 近 编 写 的 
一 个 300 行 以 上 的 程序 中 。 每 应 用 一 条 原则 , 就 为 其 编写 一 个 简短 (一 或 两 行 ) 的 注释 。 在 这 个 过 程 中 ， 
你 是 否 发 现代 码 中 有 错误 ?代码 是 否 变 得 更 清晰 了 ?还 是 有 些 部 分 更 不 清晰 了 ? 根据 这 些 结果 修改 编 
码 原则 。 
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17. 在 25.4.3 节 和 25.4.4 节 中 我 们 提供 了 一 个 Aray_ref 类 , 宣称 能 以 简单 、 安 全 的 方式 访问 数组 元 素 。 特 
别 是 我 们 宣称 它 能 正确 处 理 继承 。 尝 试用 Array_ref < Shape* > 以 不 同方 式 将 一 个 Rectangle” 放 入 
vector < Circle > 中 , 不 引起 任何 类 型 转换 或 其 他 行为 不 确定 的 操作 。 这 应 该 是 不 可 能 办 到 的 。 

<》 附 言 
那么 , 舱 人 式 程 序 设计 基本 上 就 是 “摆弄 位 " 吗 ? 完全 不 是 这 样 , 特别 是 当 你 有 意 减 少 位 运算 ， 以 免 它 

成 为 影响 正确 性 的 潜在 问题 时 。 但 是 , 在 系统 某 些 地 方 , 我 们 不 得 不 处 理 位 和 字 节 , 问题 只 是 在 哪里 ,如 何 


使 用 而 已 。 在 大 多 数 系统 中 , 低层 代码 可 以 也 应 该 局 部 化 , 不 应 使 位 运算 遍布 整个 程序 。 我 们 接触 过 的 最 
有 意思 的 系统 中 有 很 多 都 是 通 人 式 系统 , 而 一 些 最 有 意思 、 最 有 挑战 性 的 程序 设计 工作 也 是 属于 这 个 领域 。 


第 26 章 测 试 


“我 只 证 明代 码 的 正确 性 , 不 做 测试 。 
Donald Knuth 





本 章 介 绍 正 确 性 相关 的 测试 及 设计 技术 。 这 是 一 个 非常 大 的 题目 , 我 们 在 这 一 章 中 只 能 对 它 
浅 尝 辑 止 。 本 章 重 点 介绍 一 些 单元 测试 的 思想 和 技术 , 所 谓 单元 测试 , 就 是 针对 函数 和 类 等 程序 
单元 进行 测试 。 我 们 会 讨论 如 何 使 用 接口 , 以 及 如 何 选择 测试 。 我 们 将 着 重 介 绍 通过 系统 设计 来 
简化 测试 工作 ,及 在 软件 开发 的 早期 就 开展 测试 工作 的 重要 性 。 我 们 还 会 简单 介绍 程序 的 正确 性 
和 处 理性 能 问题 方面 的 内 容 。 


26. 1 我 们 想 要 什么 


让 我 们 做 一 个 简单 的 实验 : 写 一 个 二 分 搜索 程序 。 现 在 就 写 , 不 要 等 到 本 章 的 结束 , 不 要 等 
到 下 一 节 。 亲 自动 手 是 非常 重要 的 , 就 是 现在 ! 二 分 搜索 是 一 种 用 于 有 序 序列 搜索 的 方法 , 开始 
时 先 访问 序列 中 间 元 素 : 

。 如 果 中 间 元 素 等 于 我 们 要 搜索 的 元 素 , 结束 搜索 。 

。 如 果 中 间 元 素 小 于 我 们 要 搜索 的 元 素 , 我 们 继续 使 用 二 分 方法 搜索 右 半 部 分 。 

。 如 果 中 间 元 素 大 于 我 们 要 搜索 的 元 素 , 我 们 继续 使 用 二 分 方法 搜索 左 半 部 分 。 

。 结果 显示 了 搜索 是 否 成 功 , 这 里 可 以 使 用 一 些 允 许 我 们 修改 元 聚 的 工具 , 例如 , 下 标 、 指 

针 或 迭代 因子 。 

可 以 使 用 小 于 运算 ( < ) 进行 比较 (排序 ) 操 作 。 按 照 你 的 喜好 , 可 以 使 用 任何 一 种 数据 结构 , 任何 
一 种 函数 调用 规范 , 以 及 任何 一 种 返回 结果 的 方法 , 但 是 一 定 要 亲手 编写 这 个 程序 。 在 本 例 中 ， 
使 用 他 人 的 代码 是 会 起 反作用 的 ， 即便 你 列 明了 出 处 。 特 别 要 注意 的 是 , 不 要 使 用 标准 库 算法 
(binary_search 或 equal_range) ,虽然 在 大 多 数 情况 下 , 它 是 你 的 首选 。 多 花 操 时间 在 这 上 面 吧 。 

现在 你 已 经 完成 了 你 目 己 的 二 分 搜索 函数 了 。 如 果 没 有 , 请 返回 上 一 段 。 如 何 确定 你 的 搜索 
函数 是 正确 的 呢 ? 如 果 还 无 法 确定 的 话 , 你 可 以 先 写 下 你 认为 代码 正确 的 理由 。 如 何 相 信 你 的 理 
由 呢 ? 是否 有 部 分 参数 可 能 会 有 问题 ? 

这 是 一 段 简单 、 平 几 的 代码 。 它 使 用 了 最 经 典 的 算法 来 实现 。 你 的 编译 器 用 了 20 万 行 代 码 ， 
你 的 操作 系统 包含 了 1000 万 到 5000 万 行 代码 , 你 下 一 次 度假 或 开会 时 搭乘 的 飞机 上 的 安全 系统 
包含 了 50 万 到 200 万 行 代 码 。 这 会 让 你 感到 舒服 一 点 吗 ? 你 在 二 分 搜索 函数 中 使 用 的 技术 是 如 
何 应 用 到 这 类 大 型 实际 软件 中 去 的 呢 ? 

令 人 好 奇 的 是 , 虽然 包含 如 此 复杂 的 代码 , 大 多 数 大 型 软件 在 绝 大 部 分 时 间 都 能 正常 工作 。 
当然 , 我 们 也 不 会 把 以 游戏 为 主 的 消费 型 PC 上 运行 的 软件 当做 “关键 系统 ”。 对 我 们 来 说 更 为 重 
要 的 是 , 对 安全 性 要 求 严格 的 软件 几乎 需要 在 任何 时 刻 都 能 正常 运行 。 我 们 想 不 起 过 去 十 年 中 发 
生 过 因 软 件 问题 造成 飞机 或 汽车 事故 的 案例 。 至 于 金额 为 0.00 美元 的 支票 导致 银行 软件 严重 混 
乱 的 故事 , 也 已 经 非常 久远 了 , 这 些 问题 基本 上 不 会 再 发 生 了 。 但 是 ,软件 毕竟 是 像 你 我 这 样 的 
人 编写 的 。 你 很 清楚 目 己 是 会 犯错 的 , 事实 上 我 们 都 会 犯错 误 。 那 么 如 何 让 软件 不 会 出 错 呢 ? 
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最 基本 的 答案 是 :“ 我 们 ”已 经 知道 如 何 用 不 可 靠 的 组 件 构 建 可 靠 的 系统 。 我 们 尽力 让 每 一 个 
程序 、 每 一 个 类 、 每 一 个 函数 都 正确 , 但 在 最 初 总 是 会 出 错 的 。 于 是 我 们 调试 、 测试 、 重 新 设计 程 
序 , 找 出 并 排除 尽 可 能 多 的 错误 。 然 而 , 在 任何 复杂 系统 中 , 还 是 会 有 错误 隐藏 其 中 。 我 们 知道 
错误 存在 , 但 我 们 无 法 找到 它们 。 或 者 说 , 在 有 限 的 时 间 内 , 在 可 以 投入 的 人 力 、 物力 条 件 下 , 我 
们 无 法 找到 这 些 错 误 。 于 是 , 我 们 继续 重新 设计 系统 , 来 解决 这 些 不 可 预测 或 “不 可 能 ”的 错误 。 
最 终 得 到 的 可 能 是 一 个 非常 可 靠 的 系统 。 但 请 注意 ,即使 是 这 些 非常 可 靠 的 系统 ,其 中 也 隐藏 着 
错误 ， 只 不 过 大 多 数 情 况 下 系统 都 能 工作 正常 ， 只 是 偶尔 运行 状况 不 如 我 们 预期 。 但 是 , 这 类 系 
统 不 会 衣 溃 , 并 且 提 供 的 服务 总 能 满足 最 低 需求 。 例 如 , 在 通话 请 求 异常 高 的 时 候 , 电话 系统 可 
能 不 能 满足 所 有 通话 请 求 , 但 它 仍 然 可 以 提供 许多 连接 服务 。 

现在 , 我 们 可 以 上 升 到 哲学 层面 , 讨论 一 下 我 们 所 猜测 和 顾忌 的 不 可 预见 的 错误 是 否 是 真正 
的 错误 , 是 否 真 的 会 发 生 。 不 过 我 们 先 不 考虑 这 个 问题 , 我 们 要 做 的 是 更 有 价值 的 事情 : 弄 明 白 
如 何 才能 使 我 们 的 系统 更 加 稳定 。 

26. 1. 1 说 明 

测试 是 一 个 很 大 的 主题 。 很 多 人 都 在 研究 测试 应 该 怎样 做 , 不 同 的 工业 和 应 用 领域 有 着 不 同 
的 习惯 和 标准 。 这 很 自然 , 对 于 视频 游戏 软件 和 航空 系统 软件 , 你 所 需要 的 可 靠 性 标准 显然 是 不 
一 样 的 。 但 这 种 情况 会 导致 术语 和 工具 的 混乱 。 本 章 介绍 的 内 容 可 以 作为 你 个 人 项 目 进行 测试 
的 思想 源泉 ， 如果 你 参与 大 型 系统 的 测试 , 也 可 以 从 本 章 汲取 思想 。 大 型 系统 的 测试 包括 了 各 种 
测试 工具 和 组 织 结构 的 组 合 , 这 些 内 容 不 在 本 章 的 讨论 范围 之 内 。 


26.2 程序 正确 性 证 明 


等 一 下 ! 为 什么 我 们 要 为 测试 问题 忙 得 团团 转 , 为 什么 不 能 直接 证 明 程 序 的 正确 性 呢 ? 正如 
Edsger Dijkstra 一 针 见 血 地 指出 的 那样 , “测试 只 能 揭示 错误 的 存在 ， 而 不 能 证 明 不 存在 错误 ”。 这 
引出 了 对 程序 正确 性 证 明 的 一 个 明显 的 要 求 :“ 像 数学 家 证 明 数 学 定理 那样 ”。 

不 幸 的 是 , 证 明 一 个 普通 程序 的 正确 性 是 现 有 研究 所 不 能 解决 的 (一 些 非常 特殊 的 应 用 领域 
除外 ) , 而 且 证 明 本 身 也 会 包含 错误 (就 像 数学 家 也 会 出 错 一 样 ), 整个 程序 证 明 领 域 也 是 一 个 非 
常 高 深 的 研究 方向 。 因 此 , 我 们 要 尽 可 能 使 程序 更 加 结构 化 , 以 便 能 对 其 进行 推理 , 使 我 们 能 确 
信 它 是 正确 的 。 但 是 , 我 们 还 是 要 进行 测试 (参见 26. 3 节 ), 并 更 好 地 组 织 代码 , 使 之 具备 错误 恢 
复 能 力 , 能 应 对 剩余 未 发 现 的 错误 (参见 26.4 节 ) 。 


26.3 测试 


在 5.11 节 中 , 我 们 说 过 “测试 是 一 种 系统 地 查找 错误 的 方法 ”。 下 面 , 让 我 们 来 看 一 下 相关 
的 技术 。 

一 般 来 说 ， 人 们 把 测试 分 为 单元 测试 (unit testing) 和 系统 测试 (system testing) 两 种 。“ 单 元 ” 
是 指 函 数 和 类 等 程序 的 组 成 部 分 。 当 我 们 对 单元 进行 独立 测试 的 时 候 , 一 旦 错误 发 生 , 我 们 就 能 
确定 在 哪里 寻找 错误 一 一 错误 一 定 是 在 我 们 所 测试 的 单元 中 (或 者 在 用 来 引导 测试 的 代码 中 )。 
与 之 相对 , 系统 测试 只 能 告诉 我 们 系统 中 存在 错误 。 一 种 典型 情况 是 ， 当 我 们 完成 单元 测试 后 ， 
在 系统 测试 中 发 现 了 错误 , 那么 可 能 是 单元 之 间 的 交互 出 现 了 问题 。 与 独立 单元 内 的 错误 相 比 ， 
这 类 错误 更 难 查找 , 也 更 难 修复 。 

显然 ,一 个 单元 (如 一 个 类 ) 可 以 包含 多 个 小 单元 (如 函数 或 其 他 类 ) 。 一 个 系统 (如 电子 商务 
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系统 ) 也 可 以 包含 多 个 子 系 统 ( 如 数据 库 、GUI、 网 络 系统 、 订 单 确认 系统 )。 因 此 , 单元 测试 和 系 
统 测试 的 区 别 不 像 你 想象 得 那么 清晰 , 但 有 一 个 一 般 性 的 策略 : 做 好 自己 编写 的 单元 的 测试 , 这 
样 既 节 省 了 自己 的 时 间 , 也 减少 了 最 终 用 户 的 烦恼 。 

关于 测试 的 一 种 看 法 是 : 任何 复杂 系统 都 是 由 许多 单元 组 成 的 , 这些 单元 又 是 由 更 小 的 单元 
组 成 的 。 因 此 , 我 们 从 最 小 的 单元 开始 测试 ,然后 再 依次 测试 更 大 的 单元 , 直到 整个 系统 测试 完 
毕 为 止 。 也 就 是 说 ,“ 系统 "是 最 大 的 单元 (除非 我 们 用 它 来 构建 更 大 的 系统 )。 

因此 , 我 们 首先 考虑 的 是 如 何 测试 一 个 单元 (如 函数 、 类 、 骸 套 类 或 模板 ) 。 测 试 有 白 盒 测试 
(你 可 以 看 到 被 测 单 元 的 实现 细节 ) 和 黑 盒 测试 (你 只 能 看 到 被 测 单元 的 接口 ) 之 分 。 我 们 不 会 秦 
很 多 精力 区 分 这 两 种 方式 , 你 应 该 尽 一 切 办 法 了 解 被 测 单元 的 细节 。 但 要 注意 的 是 , 可 能 有 人 随 
后 修改 被 测 单元 , 因此 , 不 要 依赖 任何 在 单元 接口 中 无 法 确定 的 信息 。 实 际 上 , 测试 的 基本 思想 
是 向 接口 发 送 被 测 单元 可 以 接受 的 任何 输入 , 然后 观察 其 反应 是 否 正确 。 

需要 注意 的 是 , 因为 被 测 单元 的 代码 可 能 会 被 修改 (你 或 其 他 人 ), 这 就 需要 进行 回归 测试 。 
基本 上 , 只 要 你 修改 了 代码 , 就 必须 重新 进行 测试 , 以 保证 你 的 修改 没有 造成 破坏 。 因 此 , 在 代 
码 升级 后 , 必须 重新 进行 单元 测试 , 在 整个 系统 提交 前 (或 者 你 自己 使 用 前 ), 也 要 重新 进行 完整 
的 系统 测试 。 

这 种 对 系统 的 完整 测试 通常 称 为 回归 测试 (regression testing) , 因为 这 种 测试 通常 包括 对 以 前 
发 现 的 错误 的 再 次 检查 ,以 避免 代码 修改 将 错误 重新 引 人 。 如 果 旧 的 错误 仍然 存在 , 系统 就 “ 回 
归 ” 了, 需要 再 次 修正 错误 。 
26. 3. 1 回归 测试 

收集 在 过 去 测试 中 有 助 于 发 现 错误 的 测试 用 例 , 是 为 系统 建立 有 效 测试 集 的 主要 工作 。 如 果 
有 用 户 在 使 用 系统 的 话 , 他 们 会 将 错误 信息 发 送 给 你 。 千 万 不 要 将 这 些 错 误 报告 丢弃 , 要 用 错误 
跟踪 系统 来 确保 这 一 点 。 因 为 ,一 个 错误 报告 表明 : 或 者 存在 一 个 系统 错误 , 或 者 存在 一 个 用 户 
使 用 问题 ， 两 者 都 是 有 用 的 。 

通常 , 错误 报告 会 包括 许多 无 关 的 信息 , 我 们 的 第 一 项 任务 就 是 将 所 报告 的 问题 局 限 在 程序 
的 最 小 范围 内 。 这 经 常 要 去 除 掉 大 部 分 代码 , 一 般 我 们 会 试图 去 掉 库 的 使 用 和 不 会 导致 错误 的 应 
用 程序 代码 。 找 出 最 小 被 测 对 象 有 助 于 我 们 在 系统 代码 中 确定 错误 区 域 ,这 一 被 测 对 象 将 被 提交 
做 回归 测试 。 找 出 最 小 测试 对 象 的 方法 是 不 断 去 除 无 关 代 码 直 到 错误 出 现 为 止 , 然后 将 最 后 一 次 
去 除 的 代码 重新 加 入 。 不 断 持 续 这 一 过 程 直 到 不 能 再 删除 代码 为 止 。 

仅仅 运行 上 百 个 (或 上 万 个 ) 来 自 错误 报告 的 测试 用 例 并 不 能 表明 测试 的 系统 性 , 我 们 真正 要 
做 的 是 系统 地 利用 用 户 和 开发 人 员 的 经 验 。 回 归 测 试用 例 集 就 体现 了 开发 者 的 群体 记忆 。 对 一 
个 大 系统 来 说 , 我 们 不 能 简单 地 依靠 开发 人 员 来 了 解 设计 和 实现 的 细节 。 回 归 测 试用 例 集 就 可 以 
确保 系统 的 变化 不 会 脱离 开发 者 和 用 户 所 认可 的 范围 。 
26. 3.2 单元 测试 

好 吧 , 已 经 说 得 够 多 了 ! 让 我 们 来 尝试 一 个 实际 的 例子 吧 : 测试 一 个 二 分 搜索 。 下 面 的 描述 
来 自 ISO 标准 (参见 25. 3. 3.4 节 ): 


template<class Forwardlterator, class T> 
bool binary_searchb (Forwardjterator first , ForwardIterator last ， 
const T& value ); 


template<class ForwardIterator, class T, class Compare> 
‘bool binary_search(Forwardlterator first , ForwardIterator last ， 
const T& value , Compare comp ); 
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要 求 : | first，last) 之 间 所 有 元 素 e 按 表 达 式 e < value 和 ! (value <e) 或 comp(e, value) 和 ! 
comp (value,e) 划 分 。 并 且 ， 对 [first, last) 之 间 所 有 元 素 e 来 说 , e < value 意味 着 ! (value < e)， 
comp(e，value ) 意味 着 ! comp(value,e) 。 

返回 : 如 果 位 于 区 间 [first,last) 内 的 一 个 迭代 器 i 满足 如 下 条 件 : 1( * i < value) &&! (value < 
* ji) 或 comp( * i,value) ==false && comp(value,*i) ==false， 畏 数 返 回 真 。 

复杂 度 : 最 多 log(last -first) +2 次 比较 。 
没有 经 验 的 人 很 难 读 懂 上 述 形 式 化 定义 (好 吧 , 只 是 半 形 式 化 的 ) 。 但 是 如 果 你 已 经 真正 完成 了 本 
章 开 头 我 们 所 强烈 建议 的 二 分 搜索 编程 练习 的 话 , 你 就 会 对 如 何 实现 二 分 搜索 并 测试 它 有 一 些 很 
好 的 想法 。 这 个 (标准 ) 版 本 接受 三 个 参数 ; 两 个 前 向 迭代 器 (参见 20. 10. 1 节 ) 和 一 个 数值 。 如 果 
数值 出 现在 两 个 迭代 器 限定 的 范围 内 ， 函 数 就 返回 真 。 两 个 迭代 器 必须 对 应 一 个 有 序 序列 。 比 较 
(排序 ) 操作 通过 运算 符 “” < ”完成 。 我 们 可 以 为 binary_search 增加 一 个 参数 一 一 比较 操作 函数 ， 
这 样 就 可 以 用 用 户 指定 的 任意 比较 操作 进行 二 分 搜索 了 , 我 们 将 此 作为 练习 。 

在 这 里 ,我们 只 处 理 编译 器 不 能 发 现 的 错误 。 因 此 , 类 似 下 面 的 问题 不 再 考虑 : 


binary_search(1,4,5); Werror an int is not a forward iterator 

vector<int> v(10); 

binary_search(v.begin(),v.end(),"7"); / error: can't search for a string 
/in a vector of ints 

binary_search(v.begin(},v.end()); // error: forgot the value 


我 们 应 该 如 何 系统 地 测试 binary_search( ) 呢 ?显然 , 我们 不 可 能 测试 所 有 可 能 的 参数 。 因 为 可 能 
的 参数 值 和 类 型 的 组 合 的 数目 会 是 一 个 非常 巨大 的 数字 ! 因此 , 我 们 必须 精 挑 细 选 测试 用 例 。 我 
们 需要 一 些 选 择 标准 : 

e 很 可 能 导致 错误 的 测试 ( 找 出 大 多 数 错误 ) 。 

。 可 能 导致 严重 错误 的 测试 ( 找 出 可 能 导致 最 坏 结 果 的 错误 ) 。 
这 里 的 “严重 错误 "是 指 那些 会 导致 最 坏 结果 的 错误 。 通 常 , 这 是 一 个 模糊 的 概念 。 但 对 特定 程序 
来 说 , 就 可 能 非常 明确 。 例 如 ,和 孤立 考虑 二 分 搜索 的 话 , 所 有 错误 的 严重 程度 都 差不多 。 但 是 ， 
如 果 binary_search 是 用 于 一 个 大 程序 ， 而 该 程序 会 将 所 有 计算 绪 果 都 仔细 检查 两 过 的 话 ,“ 返 回 
一 个 错误 结果 "要 比 “ 陷 人 和 死 循环 什么 也 不 返回 "好 得 多 。 当 查找 这 类 错误 时 , 将 binary_search 
“ 骗 ”" 人 一 个 死 循环 (或 者 是 非常 长 的 循环 ), 要 比 “ 骗 " 它 返 回 一 个 错误 结果 花费 多 得 多 的 力气 。 
注意 , 我 们 使 用 了 “欺骗 "一 词 。 与 其 他 工作 相 比 , 测试 就 是 一 种 发 挥 我 们 的 创造 性 思维 , 来 达到 
“如 何 让 这 个 程序 运行 不 正常 ?” 目 的 的 活动 。 因 此 , 最 好 的 测试 人 员 不 但 要 有 系统 性 思维 , 还 要 
非常 “ 狐 独 "(当然 , 要 有 正当 的 理由 )。 

26. 3.2. 1 测试 策略 

我 们 应 该 如 何 破 坏 binary_search 的 正常 运行 呢 ? 首先 , 我 们 要 检查 binary_search 的 要 求 , 即 它 对 于 
输入 的 假设 是 怎样 的 。 不 幸 的 是 , 从 测试 者 的 观点 来 看 ，binary_search 明确 声明 [first ,last) 必须 是 有 序 
序列 , 也 就 是 说 , 确保 这 一 点 是 调用 者 的 责任 。 因 此 , 我 们 不 能 通过 输入 无 序 序列 , 或 者 last < first 来 破 
坏 binary_search, 那 是 不 公平 的 。 注 意 , 在 binary_search 的 要 求 中 并 没有 说 明 , 如 果 我 们 给 定 的 输入 不 
满足 条 件 的 话 , 它 会 如 何 做 。 在 ISO 标准 的 其 他 地 方 , binary_search 声明 : 对 于 不 满足 要 求 的 输入 , 它 
可 能 会 抛 出 一 个 异常 , 但 这 不 是 强制 的 。 我 们 要 记 住 这 些 事实 ， 当 测试 其 他 程序 对 binary_search 的 使 用 
方式 时 , 这 些 事实 是 很 有 用 的 : 调用 者 给 出 不 满足 函数 要 求 的 输入 , 显然 可 能 成 为 错误 之 源 。 

我 们 设想 binary_search 可 能 出 现下 列 错误 ; 

。 不 返回 (例如 , 无 限 循环 ) 
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。 崩溃 (例如 ,错误 的 引用 , 无 限 递归 ) 

e 未 找到 值 ， 即 使 该 值 确实 在 序列 中 

。 找到 了 值 , 但 该 值 并 不 在 序列 中 
此 外 , 我 们 还 要 记 住 下 列 序列 会 给 用 户 错误 "可 乘 之 机 ”: 

。 序列 未 排序 (例如 ,1{2,1,5, -7,2,10} )。 

e 序列 不 合法 (例如 ,binary_search( &a[ 100], &a[ 50], 77)) 
我 们 只 不 过 是 简单 调用 binary_search( pl, p2, v) 而已, 为 什么 函数 还 会 出 现 错误 呢 ( 均 为 测试 者 
发 现 的 销 误 )? 一 般 来 说 , 通常 是 “特殊 情况 ”导致 错误 发 生 。 特 别 是 ， 当 测试 对 象 是 处 理 序列 的 
程序 时 ,可 以 从 序列 开始 和 末尾 人 手 构造 “特殊 序列 ”。 另 外 , 我 们 人 
让 我 们 先 来 看 一 些 有 序 的 整 型 数组 : 


{1,2,3,5,8,13,21} // an “ordinary sequence” 
{} // the empty sequence 

{1} // just one element 
{1,2,3,4} // even number of elements 
{1,2,3,4,5} /odd number of elements 
{1,1,1,1,1,1,1)} // all elements equal 


{0,1,1,1,1,1,1,1,1,1,1,1,1 } / different element at beginning 
{0,0,0,0,0,0,0,0,0,0,0,0,0,1} /different element at end 


也 可 以 用 程序 来 生成 一 些 测试 序列 : 
vector<int> v1; 
e for (int i=0; i<100000000; ++i) v.push_back(i); // a very large sequence 


® 一 些 元 素 个 数 随机 的 序列 

。 一 些 由 随机 数组 成 的 序列 ( 仍 是 有 序 的 序列 ) 
这 不 是 我 们 预期 的 那 种 系统 测试 。 毕 竟 , 我 们 只 是 “ 挑 拒 ”了 一 些 序列 。 但 是 , 这 里 用 到 了 一 些 处 
理 数据 集 时 很 有用 的 一 般 性 原则 , 包括: 

。 空 集 

e。 小 数据 集 

。 大 数据 集 

。 极限 分 布 的 数据 集 

。 序列 末尾 处 可 能 发 生 问题 的 数据 集 

。 包含 重复 元 素 的 数据 集 

。 包含 奇数 和 偶数 个 元 素 的 数据 集 

。 由 随机 数组 成 的 数据 集 
使 用 随机 数 序列 的 目的 是 看 看 是 否 能 幸运 地 发 现 一 些 我 们 没有 考虑 到 的 错误 。 这 是 一 种 蛮 力 技 
术 , 但 是 能 节省 我 们 的 时 间 。 

为 什么 要 使 用 “奇数 /偶数 "个 元 素 的 序列 呢 ? 这 是 因为 很 多 算法 都 会 用 划分 的 方法 把 输入 序列 分 
为 两 部 分 , 而 程序 员 可 能 只 考虑 了 奇数 情况 或 偶数 情况 。 更 一 般 的 问题 是 ， 当 我 们 划分 一 个 序列 的 时 
候 , 划分 点 会 成 为 一 个 子 序列 的 末尾 。 正 如 我 们 所 知 , 序列 的 末尾 往往 是 错误 容易 发 生 的 地 方 。 

一 般 来 说 , 在 设计 测试 用 例 时 我 们 应 该 重点 考虑 : 

e。 极限 情况 (大 的 、 小 的 、 奇 异 分 布 的 输入 等 ) 

。 边界 条 件 ( 边 界 附近 的 任何 情况 ) 

“极限 情况 ”"、“ 边 界 条 件 ” 具 体 是 什么 含义 , 取决 于 我 们 所 测试 的 实际 程序 。 
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26. 3. 2.2 一 个 简单 的 测试 

我 们 可 以 进行 两 类 测试 : 应 该 搜索 成 功 的 测试 (例如 , 搜索 在 序列 中 确实 存在 的 值 ); 应 该 搜 
索 失 败 的 测试 (例如 , 搜索 一 个 空 集 ) 。 对 每 一 组 输入 序列 , 我们 都 会 构造 应 该 成 功 和 应 该 失败 的 
测试 用 例 。 我 们 将 从 最 简单 和 最 明显 的 用 例 开 始 , 然后 逐步 改进 ,直至 找到 对 binary_search 来 说 
足够 好 的 测试 用 例 : 


int al] = { 1,2,3,5,8,13,21 }; 
if (binary_search(a,atsizeof(a)/sixeof(*a),1) == false) cout << "failed"; 
if (binary_search(a,a+sizeof(a)/sizeof(*a),5) == false) cout << "failed"; 
if (binary_search(a,atsizeof(a)/sizeof(*a),8) == false) cout << "failed"; 
if (binary_search(a,at+sizeof (a)/sizeof(*a),21) == false) cout << "failed"; 
if (binary_search(a,at+sizeof(a)/sizeof(*a),~7) == true) cout << "failed"; 
if (binary_search(a,a+sizeof(a)/sizeof(*a),4) == true) cout << "failed"; 
if (binary_search(a,atsizeof(a)/sizeof(*a),22) == true) cout << "failed"; 


这 个 测试 虽然 有 些 重复 和 繁琐 , 但 却 是 一 个 不 错 的 开端 。 实 际 上 , 许多 简单 的 测试 集 与 这 个 例子 
一 样 , 就 是 一 个 长 长 的 调用 序列 。 这 种 方法 最 大 的 优点 就 是 简单 。 即 使 是 一 个 新 手 , 也 能 够 在 测 
试 集 中 加 入 新 的 测试 用 例 。 但 是 , 我 们 通常 还 可 以 做 得 更 好 。 例 如 ， 当 某 个 测试 失败 时 , 这 个 程 


序 没有 告诉 我 们 哪个 测试 用 例 失败 了 。 这 是 不 可 接受 的 , 改进 如 下 : 

int a[] = {1,2,3,5,8,13,21 }; 

if (binary_search(a,at+sizeof(a)/sizeof(*a),1) == false) cout << "1 failed"; 

if (binary_search(a,a+sizeof(a)/sizeof(*a),5) == false) cout << "2 failed"; 

if (binary_search(a,at+sizeof(a)/sizeof(*a),8) == false) cout << "3 failed"; 

if (binary_search(a,at+sizeof(a)/sizeof(*a),21) == false) cout << "4 failed"; 

if (binary_search(a,at+sizeof(a)/sizeof(*a),~7) == true) cout << "5 failed"; 

if (binary_search(a,at+sizeof(a)/sizeof(*a),4) == true) cout << "6 failed"; 

if (binary._search(a,a+sizeof(a)/sizeof(*a),22) == true) cout << "7 failed"; 


假定 最 终 我 们 会 进行 数 十 个 测试 ,有 没有 这 种 改进 就 会 大 不 一 样 了 。 对 于 真实 系统 , 我 们 经 常 要 
进行 几 千 个 测试 。 因 此 , 准确 定位 哪个 测试 出 错 是 非常 必要 的 。 

在 继续 讨论 之 前 , 请 注意 上 面 例子 中 所 体现 出 的 ( 半 系 统 化 ) 测 试 技术 : 我 们 从 序列 的 末尾 和 
“中 部 ” 取 一 些 值 作为 要 搜索 的 值 , 这 些 测试 用 例 应 导致 搜索 成 功 。 我 们 当然 可 以 将 该 序列 的 所 有 
值 逐一 作为 输入 , 但 这 显然 是 不 现实 的 。 对 于 导致 搜索 失败 的 测试 用 例 , 我 们 从 序列 两 端 和 中 部 
各 选择 一 个 值 (不 在 序列 中 的 值 ) 。 当 然 , 这 也 不 是 一 种 系统 化 的 测试 方法 , 但 这 种 测试 用 例 构造 
模式 是 一 种 十 分 常用 的 技术 , 它 在 测试 数值 序列 或 数值 范围 类 程序 时 非常 有 用 。 

这 些 初步 的 测试 有 什么 问题 么 ? 

。 重复 编写 相同 的 代码 。 

。 手工 设 定 测试 编号 。 

。 输出 信息 很 少 (用 处 也 不 大 )。 : z | 
经 过 仔细 考虑 后 , 我 们 决定 把 测试 用 例 保存 在 文件 中 。 每 个 测试 都 包含 一 个 唯一 的 标签 、 一 个 要 
搜索 的 值 、 数 值 序列 以 及 期 望 的 计算 结果 。 例 如 ， 


{277{123581321}0) 
这 个 测试 的 编号 是 27。 它 在 序列 1,2,3,5 ,8,13 ,21| 中 查找 7, 期 望 运 行 结果 是 0( 即 失败 ) 。 我 们 
为 什么 要 把 测试 用 例 保存 到 文件 中 , 而 不 是 把 它们 硬 编码 到 程序 中 呢 ? 是 的 , 对 于 这 个 例子 来 
我 们 可 以 直接 输入 测试 用 例 , 放 在 程序 中 。 但 是 , 在 程序 中 放 人 大 量 数据 , 无 疑 会 使 程序 变 
得 杂乱 无 章 。 而 且 , 我 们 经 常会 用 程序 生成 测试 用 例 ， 而 不 是 手工 编写 。 计 算 机 生成 的 测试 用 例 
一 地 六 存在 数据 人 无 法 直接 放 在 程序 之 中 。 现 在 , 我 们 可 以 编写 一 个 使 用 各 种 不 同 测试 
用 例文 件 的 测试 程序 了 
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struct Test { 
string label; 
int val; 
vector<int> seq; 
bool res; 

}; 


istream& operator>>(istream& is, Test& t); // use the described format 


int test_all() 

{ 
int error_count = 0; 
Test t; 


While (cin>>t) { 
boolr = binary_search( t.seq.begin(), t.seq.end!(), t.val); 


if (r I!=t,.res) { 
cout << "failure: test " << t.label 
<< "binary_search: " 
<<t.seq.size() << " elements, val==" << t.val 
< 一 > <etres<e "nNn'; 
++error_count; 
} 
} 
return error_count; 
} 


int main() 
{ 
int errors = test_all(); 
cout << "number of errors: " << errors << "Nn", 


} 


下 面 是 我 们 所 使 用 的 部 分 输入 序列 : 
{1.11{123581321}1)} 
{1.25{123581321}1} 
{1.38{123581321}1} 
{1.421{123581321}1)} 
{1.5-7{123581321}0} 
{1.64{123581321}0} 
{1.722{123581321}0)} 


{21{}0} 


{3,11{1}1} 
{3.20{1}0} 
{3.32{1}0} 


在 这 里 可 以 看 出 , 为 什么 我 们 将 标签 定义 为 字符 串 类 型 ， 而 不 是 数值 类 型. 可 以 更 灵活 地 为 测试 
“编号 "一 一 本 例 中 使 用 了 带 小 数 的 标签 , 来 区 分 同一 个 序列 之 上 的 不 同 测试 。 我 们 还 可 以 使 用 更 
复杂 的 格式 , 来 避免 在 测试 数据 文件 中 反复 给 出 同一 个 序列 。 
26. 3.2.3 随机 序列 
在 选择 测试 数据 的 时 候 , 我 们 会 尽力 击败 程序 编写 者 (常常 就 是 我 们 自己 ) , 会 重点 在 那些 可 
能 隐藏 有 错误 的 区 域 选 择 数 据 ( 例 如 , 复杂 的 条 件 序列 、 序 列 末尾 处 、 循 环 序 列 等 ) 。 但 是 , 由 于 
通 第 我 们 就 是 程序 的 编写 者 , 我 们 在 编写 和 调试 代码 时 已 经 考虑 过 这 些 因 素 了 。 因 此 , 我 们 在 设 
计 测试 方案 时 很 可 能 重复 编写 程序 时 所 犯 的 逻辑 错误 , 这 导致 一 些 重要 问题 被 忽略 。 这 也 是 为 什 
么 要 让 与 开发 人 员 无 关 的 另 一 些 人 参与 到 测试 方案 设计 中 来 的 原因 之 一 。 有 一 种 技术 有 时 会 对 
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解决 这 一 问题 有 所 帮助 : 简单 地 生成 (许多 ) 随机 值 。 下 面 这 个 也 数 使 用 rand_int( ) (参见 24.7 
节 ) 生 成 一 个 二 分 搜索 测试 用 例 , 并 输出 到 cout: 


void make_test(const string& lab, int n, int base, int spread) 
// write a test description with the label lab to cout 
/ generate a sequence of n elements starting at base 
/ the average distance between elements is spread 


cout<<"{"<<lab<<" "<<n<<"{" 

vector<int> v; 

int elem = base; 

for (inti=0; i<n; ++i){  //make elements 
elem+= rand int(spread); 
v.push_back(elem); 

} 


int val = base+ rand int(elem-base); // make search value 

bool found = false; 

for (int i = 0; i<n; ++i) { / print elements and see if val is found 
if (v[i]==val) found = true; 
cout <<vI] << "1 

} 

cout <<"}" <<found << " Mn", 

} 


请 注意 我 们 没有 用 binary_search 来 检验 随机 数 val 是 否 在 随机 序列 中 。 我 们 不 能 用 符 测 程序 来 检 
查 测 试 的 正确 性 。 

实际 上 ，binary_search 并 不 特别 适合 用 随机 数 序列 进行 蛮 力 测试 。 虽 然 我 们 对 这 些 测试 用 例 
能 否 发 现 我 们 “手工 构造 ”的 测试 用 例 末 发 现 的 错误 持 怀 疑 态度 , 但 这 些 技 术 通 常 还 是 很 管用 的 。 
不 管 怎么 样 ， 让 我 们 先 动手 构造 一 些 基于 随机 数 的 测试 : 

intno_of_ tests = rand int(100); /make about 50 tests 

for (inti=0;i<no_of_ tests; ++i) { 


string lab = "rand_test_"; 
make_test(lab+to_string(i), / to_string from $23.2 


rand int(500), // number of elements 
0, // base 
rand int(50)); /spread 


} 
如 果 我 们 需要 测试 很 多 操作 的 累积 效应 ， 而 一 个 操作 的 结果 取决 于 之 前 的 操作 是 如 何 处 理 的 话 。 
即 系统 是 有 状态 的 (参见 5.2 节 ) ,系统 运行 就 是 状态 间 的 迁移 。 对 于 这 种 情况 , 基于 随机 数 的 测 
试用 例 特别 有 用 。 

基于 随机 数 的 测试 用 例 对 binary_search 效果 不 是 很 明显 , 原因 在 于 , 对 于 同一 个 序列 , 不 同 
搜索 之 间 都 是 独立 的 。 当 然 , 这 个 结论 的 前 提 是 假定 binary_search 的 实现 中 没有 犯 致命 的 愚 狼 错 
误 , 例如， 对 序列 进行 了 修改 。 对 此 , 我 们 可 以 设计 一 个 更 好 的 测试 用 例 (参见 习题 5) 。 
26. 3. 3 ”算法 和 非 算 法 

上 文 以 binary_search( ) 为 例 介绍 了 一 些 简单 的 测试 技术 ， a 全 合乎 格 
式 要 求 的 算法 , 它 具 有 下 列 特点 : 

。 对 输入 数据 有 明确 的 要 求 。 

。 明确 描述 了 算法 运行 后 对 输入 数据 有 什么 影响 (在 本 例 中 ， 没有 影响 )。 

。 算法 不 依赖 于 显 式 输入 之 外 的 数据 。 

。 对 于 外 部 环境 没有 严格 限制 (例如 , 没有 特殊 的 时 间 、 空间 和 资源 共享 要 求 )。 
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它 还 包含 了 明显 的 前 置 和 后 置 条 件 (参见 5. 10 节 ) 。 换 句 话说 , 它 是 测试 人 员 梦 襟 以 求 的 。 但 是 ， 
我 们 不 可 能 总 是 这 么 幸运 : 很 多 时 候 我 们 不 得 不 测试 用 糟糕 的 英文 和 很 多 图 表 表 示 的 混乱 代码 
(这 还 是 乐观 估计 )。 z z 

等 一 下 , 我 们 是 否 对 混乱 的 程序 逻辑 有 些 放 任 了 呢 ? 在 不 能 准确 描述 代码 要 做 什么 的 情况 
下 , 我 们 如 何 能 够 讨论 正确 性 和 测试 呢 ? 但 问题 是 , 在 软件 开发 、 测 试 中 , 很 多 内 容 都 很 难 用 非 
常 清晰 的 数学 形式 来 描述 。 而 且 , 很 多 时 候 虽 然 在 理论 上 能 够 给 出 严谨 的 数学 描述 , 但 所 需 数学 
知识 超出 了 编写 和 测试 代码 的 程序 员 的 能 力 。 因 此 , 在 现实 世界 的 实际 条 件 以 及 时 间 的 双重 压力 
下 , 我 们 只 好 放弃 准确 描述 被 测 程序 的 理想 目标 , 而 要 面 对 现实 : 只 要 被 测 程序 在 (测试 人 员 , 很 
多 时 候 就 是 我 们 自己 ) 掌握 之 中 就 可 以 了 。 

假设 你 要 测试 一 个 混乱 的 函数 代码 , 这 里 “混乱 ”是 指 : 

。 输 入; 它 对 输入 ( 隐 式 或 显 式 的 ) 的 要 求 没有 像 我 们 希望 的 那样 进行 准确 定义 。 

。 输出: 它 对 输出 ( 隐 式 或 显 式 的 ) 的 要 求 没有 像 我 们 希望 的 那样 进行 准确 定义 。 

。 资源 : 它 所 使 用 的 资源 (时 间 、 内 存 、 文件 等 ) 没 有 像 我 们 希望 的 那样 准确 定义 。 

这 里 的 “ 隐 式 或 显 式 ” 表示 我 们 不 但 要 检查 正式 的 参数 和 返回 值 , 还 要 检查 函数 对 全 局 变量 、 
iostream、 文件 、 空闲 内 存 空间 的 分 配 等 的 影响 。 那 么 , 我 们 要 怎么 做 呢 ? 首先, 这 类 函数 一 般 都 
很 长 , 或 者 我 们 不 能 把 它 的 需求 和 影响 描述 清楚 。 也 许 我 们 讨论 的 是 一 个 有 5 页 长 的 函数 , 或 者 
它 使 用 复杂 且 不 明确 的 “帮助 函数 ”的 方式 。 你 可 能 会 认为 5 页 很 长 了 ,是 的 , 这 确实 很 长 , 但 我 
们 还 会 遇 到 更 长 的 函数 。 而 且 不 幸 的 是 , 这 种 事情 经 常会 发 生 。 

如 果 这 是 我 们 写 的 代码 并 且 有 时 间 的 话 , 首先 要 做 的 是 把 这 些 “ 混 乱 的 函数 ”分 割 成 为 许多 小 
函数 。 每 个 小 函数 都 符合 我 们 理想 中 的 严格 定义 函数 , 然后 首先 测试 这 些小 函数 。 但 是 , 我 们 的 
目标 是 测试 软件 一 一 即 系统 地 找 出 尽 可 能 多 的 错误 一 一 而 不 是 修正 找到 的 错误 。 

那么 , 我 们 要 找 什 么 呢 ?” 作 为 测试 人 员 , 我 们 的 任务 是 找 出 错误 。 错 误 可 能 隐藏 在 哪 呢 ? 包 
含 错误 的 代码 有 什么 特点 呢 ? z 

。 与 “其 他 代码 ”微妙 的 相关 性 : 因此 我 们 可 以 检查 全 局 变量 、 非 常量 引用 参数 、 指 针 等 的 使 用 。 

e 资源 管理 ; 查找 内 存 管理 (new 和 delete 操作 )、 文 件 使 用 、 锁 等 。 

。 查找 循环 ; 检查 终止 条 件 ( 例 如 binary_search( ) ) 。 

。 过 和 switch 语句 (也 称 为 “分 支 语句 ”) : 查找 这 些 程序 中 的 逻辑 错误 。 

让 我 们 逐个 举例 说 明 。 

26. 3. 3.1 相关 性 

考虑 下 面 这 个 无 意义 的 函数 : 


int do_dependent(int a, int& b) / messy function 
// undisciplined dependencies 
{ 
int val ;» 
cin>>val; 
vec[val] += 10; 
cout << a: 
b++; 
return b; 


} , 
在 测试 do_dependent( ) 的 时 候 , 我 们 不 能 仅仅 检查 参数 合法 性 ,以 及 函数 对 参数 做 了 什么 运算 。 
我 们 还 要 考虑 函数 所 使 用 的 全 局 变量 cin 、cout 和 vec。 在 这 个 小 函数 中 , 对 这 些 全 局 变量 的 使 用 
方式 很 容易 看 清 , 但 在 实际 程序 中 , 这 些 细节 往往 会 隐藏 在 大 量 代 码 中 间 。 幸 运 的 是 , 一 些 软件 
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可 以 帮助 我 们 找 出 这 种 相关 性 。 不 幸 的 是 , 这 一 办 法 并 不 总 是 可 行 , 也 很 难 推广 。 假 定 没有 分 析 
软件 能 帮助 我 们 , 我 们 只 能 逐 行 检查 代码 , 找 出 其 中 所 有 的 相关 性 。 

在 测试 do_dependent( ) 的 时 候 , 我 们 需要 考虑 

。 它 的 输入 : 
" a 的 值 
ab 的 值 以 及 b 所 引用 的 整 型 值 
a cin 的 输入 值 ( 存 人 val) 和 cin 的 状态 
se cout 的 状态 
多 Vec 的 值 ， 以 及 vec[ val | 的 值 
它 的 输出 : 
" 人 返回 值 
sb 所 引用 的 整 型 值 (我 们 对 它 做 了 增 量 操作 ) 
s cin 的 状态 (包括 流 状 态 和 格式 状态 ) 
u cout 的 状态 (包括 流 状 态 和 格式 状态 ) 
s vec 的 状态 (我 们 对 vec[ valj] 做 了 赋值 操作 ) 
s 任何 vec 可 能 抛 出 的 异常 (vec[ valj 可 能 越界 ) 
这 是 一 个 很 长 的 列表 , 实际 上 , 它 比 函数 本 身 都 要 长 。 这 也 可 以 解释 为 什么 我 们 不 喜欢 全 局 变 
量 , 并 且 非 常 关 注 非常 量 引用 (以 及 指针 ) 。 最 理想 的 情况 莫 过 于 一 个 函数 仅 读 和 人 它 的 参数 ,计算 
结果 只 以 返回 值 的 形式 给 出 ; 这 样 我 们 就 能 很 容易 地 理解 并 测试 这 样 的 函数 。 

一 旦 确定 了 输入 和 输出 , 我 们 就 可 以 回 过 头 来 看 看 binary_search( ) 的 例子 。 我 们 测试 的 方式 
是 给 出 输入 值 ( 隐 式 或 显 式 的 输入 ), 检查 也 数 是 否 输 出 期 望 的 结果 ( 隐 式 或 显 式 的 )。 对 于 do_ 
dependent( ) , 我 们 需要 从 一 个 非常 大 的 val 值 和 负 的 val 值 开 始 , 来 看 看 它 会 输出 什么 。 而 且 , 看 
上 去 vec 最 好 具备 边界 检查 机 制 (否则 我 们 可 以 很 容易 地 构造 出 非常 严重 的 错误 ) 。 当 然 , 我们 还 
要 按照 文档 的 说 明 检查 所 有 的 输入 和 输出 。 但 对 于 这 种 混乱 的 函数 来 说 , 我 们 不 要 期 望 它 会 有 清 
晰 、 完 整 和 准确 的 说 明 。 因 此 , 我 们 只 需 考 虑 如 何 击 破 这 个 函数 ( 即 找到 错误 ), 然后 开始 询问 什 
么 是 正确 的 。 通 常情 况 下 ,这样 的 测试 和 询问 会 导致 代码 的 重新 设计 。 

26. 3.3.2 资源 管理 

考虑 下 面 这 个 无 意义 的 函数 : 


void do_resourcesl1(int a, int b, const char* s) / messy function 
// undisciplined resource use 


{ 
FILE* f = fopent(s,"r"); // open file (C style) 


int* p = new int[a]; // allocate some memory 

if (b<=0) throw Bad_arg(); /W maybe throw an exception 

int* q = new int[b]; // allocate some more memory 

delete[] p; // deaiiocate the memory pointed to by p 


} 
在 测试 do_resources1( ) 的 时 候 , 我 们 必须 考虑 每 个 申请 到 的 资源 是 否 都 被 妥善 处 理 了 , 即 是 否 每 
一 个 资源 都 被 释放 或 者 转交 给 了 其 他 函数 了 。 

在 本 例 中 , 显然 存在 这 些 问 题 

。 名 为 s 的 文件 没有 关闭 。 

。 如 果 b < =0 或 者 第 二 个 new 发 生 异 党 的话, 指针 Pp 指向 的 内 存 会 发 生 汇源 。 

。 如 果 0 <b 的 话 , 指针 q 指向 的 内 存 会 发 生 泄漏 。 


锅 26 葛 测 碟 599 


此 外 , 我 们 还 要 考虑 打开 文件 操作 可 能 会 失败 。 为 了 显示 这 种 糟糕 的 结果 , 我 们 故意 使 用 了 一 种 
非常 古老 的 编程 风格 (fopen( ) 是 C 语言 中 的 打开 文件 的 标准 方法 ) 。 的 工作 更 为 
简单 , 我们 可 以 将 代码 改写 如 下 : 


void do_resources2(int a, int b, const char* s) //less messy function 


ifstream is(s); // open file 

vector<int>v1(a); / create vector (owning memory) 

if (b<=0) throw Bad_arg(); // maybe throw an exception 
vector<int> v2(b); // create another vector (owning memory) 


} 
现在 每 一 块 内 存 空间 都 被 一 个 能 够 自己 释放 内 存 的 对 象 所 拥有 。 考 虑 如 何 才 能 写 出 更 简洁 (更 清 
晰 ) 的 函数 ,有 时 是 思考 测试 方法 的 很 好 途径 。19. 5.2 节 中 的 “分 配 到 的 资源 都 要 进行 初始 化 ” 
(RAII) 技术 提供 了 一 种 解决 资源 管理 问题 的 一 般 策 略 。 

需要 注意 的 是 , 资源 管理 不 仅仅 是 检查 每 一 块 内 存 是 否 被 释放 。 有 时 , 我 们 会 从 其 他 地 方 接 
收 到 资源 (例如 作为 参数 ), 有 时 我 们 也 会 将 资源 传 出 函数 (例如 作为 返回 值 ) 。 在 这 种 情况 下 , 很 
难 确定 什么 是 正确 的 。 考 虑 下 面 的 函数 : 


FILE* do_resources3(int a, int* p, const char* S) I messy function 
/ undisciplined resource passing 
{ 
FILE* f = fopen(s,"r"); 
delete p; 
delete var; 
var = new int[27]; 
return f; 


} z 
do_resources3( ) 将 打开 的 文件 作为 返回 值 是 否 正确 呢 ? 通过 参数 p 传递 给 它 的 内 存 释放 是 否 正 确 
呢 ? 此 外 , 我 们 还 偷偷 改变 了 全 局 变量 var( 显然 它 是 一 个 指针 ) 。 基 本 上 , 将 资源 传 进 / 传 出 是 很 
常见 也 很 有 和 用 的 , 但 要 知道 资源 传递 是 否 正确 , 还 要 掌握 一 些 资源 管理 策略 方面 的 知识 。 谁 拥有 
这 些 资 源 ? 谁 将 删除 /释放 这 些 资源 ?程序 文档 应 该 清楚 、 简洁 地 回答 这 些 问 题 (通常 只 是 我 们 的 
美好 愿望 ) 。 不 管 怎样 , 资源 的 传递 都 是 孕育 错误 的 温床 ， 当 然 这 也 是 测试 的 重点 之 一 。 

需要 注意 的 是 , 在 上 面 的 例子 中 , 我 们 是 如 何 通过 使 用 全 局 变量 (故意 地 ) 使 资源 管理 复杂 化 
的 。 当 我 们 把 各 种 可 能 的 错误 来 源 混杂 在 一 起 的 时 候 , 一 切 都 会 变 得 糟糕 。 作 为 程序 员 ， 我 们 要 
避免 这 一 点 。 作 为 测试 人 员 , 我 们 要 重点 检查 这 种 情况 。 

26. 3. 3.3 循环 

当 我 们 讨论 binary_search( ) 的 时 候 , 对 循环 结构 进行 了 检查 。 基 本 上 , 大 部 分 错误 都 是 在 循 
环 结 构 中 发 生 的 : 

e 在 开始 循环 的 时 候 , 是 否 所 有 数据 都 正确 地 初始 化 了 ? 

。 循环 是 否 正确 地 终止 了 呢 ( 经 常 是 在 最 后 一 个 元 素 出 问题 )? 

直面 是 一 个 循环 结构 出 错 的 例子 : 


int do_joop(vector<int>& v) /messy function 
jundisciplined loop 
《 
int i; 
int sum; 
while(i<=vec.size()) sum+=v[i]; 
return sum; 


a ( 哪 三 处 ?) 此 外 , 好 的 测试 人 员 应 该 马上 意识 只 到 对 sum 的 加 法 运算 
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可 能 会 导致 溢出 问题 。 
。 很 多 循环 都 包含 数据 处 理 , 因此 当 有 大 量 输入 数据 时 ， 可 能 会 产生 某 种 溢出 错误 。 
一 个 臭名 昭著 的 循环 错误 是 缓冲 区 游 出 , 我 们 可 以 通过 系统 地 询问 两 个 关于 循环 的 关键 问 


题 , 来 捕获 这 类 错误 : 
char bufIMAX]; /fixed-size buffer 


char* read_jine() / dangerousiy sloppy 
{ 


inti = 0; 

char ch; 

while(cin.get(ch) && chi="\n') bufli++] = ch; 
bufli+1] = 0; 

return buf; 


} 
当然 , 你 不 会 如 此 编写 代码 ! (为 什么 不 ? read_line( ) 有 什么 问题 吗 ?) 但 糟糕 的 是 , 这 种 代码 编 
写 方 法 很 常见 , 而 且 还 有 许多 变化 形式 , 例如 : 

// dangerously sloppy: 


gets(buf); // read a line into buf 
scanf("%s" ,buf}; //read a line into buf 


在 文档 中 查阅 gets( ) 和 scanf( ) 的 相关 内 容 , 要 像 躲 避 瘟 疫 一 样 驹 开 这 两 个 函数 。 这 里 “危险 ”的 
含义 是 : 这 种 缓冲 区 溢出 是 “黑客 攻击 ”( 即 非法 疼 入 计算 机 系统 ) 的 主要 手段 。 现 在 很 多 编译 右 
都 会 对 gets( ) 及 其 近亲 给 出 警告 信息 , 原因 就 在 于 此 。 

26. 3.3.4 分 支 

显然 ， 当 必须 做 出 选择 的 时 候 , 我 们 可 能 会 做 出 错误 的 抉择 。 这 就 使 得 过 和 switch 语句 成 为 
测试 人 员 的 好 目标 。 有 两 个 主要 问题 需要 检查 : 

。 所 有 的 可 能 性 都 被 禾 盖 了 吗 ? 

。 操作 是 否 与 分 支 正确 联系 起 来 了 ? 
考虑 下 面 这 个 一 数 : 


void do_branch1(int x, int y) / messy function 
// undisciplined use of if 
{ 
if (x<0) { 
if (y<0) 
cout << "very negative\n"; 
else 
cout << "somewhat negativen"; 


ee if (>0) { 
if (y<0) 
cout << "very positiven"; 
a cout << "somewhat positive\n"; 
} : 
其 中 最 明显 的 错误 是 我 们 “忘记 ”了 x 是 0 的 情况 。 当 测试 非 0 值 的 时 候 ( 或 是 测试 正 值 和 负 值 的 
时 候 ) , 0 经 常 被 忘记 或 者 错误 地 与 其 他 情况 混在 一 起 (例如 考虑 负数 的 情况 )。 此 外 , 这 个 程序 
中 还 隐藏 着 一 个 很 微妙 (但 不 常见 ) 的 错误 : (x >0 &&y<0) 和 (x>0&&y> =0)， 从 某 种 角度 
看 ,它们 是 被 颠倒 了 。 这 通常 是 在 编辑 程序 时 使 用 甬 切 - 粘贴 操作 所 导致 的 。 
让 语句 的 使 用 方式 越 复 杂 ， 就 越 可 能 出 现 这 种 错误 。 从 测试 人 员 的 角度 出 发 ,我们 应 该 检查 
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代码 并 确保 所 有 分 支 都 已 被 测试 。 对 于 do_branchl ( ) 来 说 , 一 个 明显 的 测试 上 集 是 
do_branch1(-1,—1); 
do_branchi(-1, 1); 
do_branch1(1,=1); 
do_branch1(1,1); 
do_branchi(-1,0); 
do_branch1(0,—1); 
do_branch1(1,0); 
do_branch1(0,1); 
do_branch1(0,0); 
基本 上 , 这 是 一 种 蛮 力 测试 方法 , 通过 “遍历 所 有 可 能 "来 查找 错误 。 由 于 我 们 已 经 注意 到 do_ 
branch1( ) 使 用 ”< "和 ”> "检测 非 0 值 , 因此 采用 了 这 一 方法 。 此 外 , 为 了 检查 x 为 正 值 时 的 可 
能 错误 , 我 们 还 需要 把 每 个 调用 与 期 望 的 正确 结果 结合 起 来 。 
处 理 switeh 语句 的 方法 与 让 语句 基本 上 是 一 样 的 。 
void do_branchi(int x int y) // messy function 
I undisciplined use of switch 
{ 
if (y<0 && y<=3) 
switch (x) { 
case 1: 
cout << "onen"; 
break; 
Case 2: 
cout << "twon"; 
Case 3: 
cout << "three\n"; 
} 
} 


这 里 , 我 们 犯 了 4 个 错误 : 

e 我 们 对 错误 的 变量 进行 了 范围 检查 (应 该 是 y 而 不 是 x)。 

e。 对 x==2, 我 们 忘记 了 break 语句 , 这 会 导致 错误 的 操作 。 

。 我 们 忘记 了 default 情况 (认为 在 让 语句 中 已 经 考虑 了 这 种 情况 ) 。 

es 我 们 使 用 了 y <0 而 实际 上 我 们 的 意思 是 0 <y。 
作为 测试 人 员 , 我 们 一 定 要 检查 这 些 未 处 理 的 情况 。 请 注意 , 仅仅 “修复 错误 ”是 不 够 的 。 如 果 我 
们 不 检查 所 有 可 能 的 情况 , 错误 还 可 能 再 次 出 现 。 作 为 测试 人 员 , 我 们 希望 能 够 系统 地 捕捉 到 所 
有 可 能 的 错误 。 这 样 简单 的 代码 , 如 果 只 是 修正 错误 , 我 们 很 可 能 在 修正 过 程 中 再 犯错 , 不 仅 不 
能 解决 问题 , 甚至 还 可 能 引信 新 的 不 同 的 错误 。 检 查 代码 的 目的 并 不 是 要 找到 错误 (虽然 这 很 重 
要 ) ， 而 是 要 设计 出 能 够 捕获 所 有 错误 的 测试 集 ( 或 者 现实 一 点 , 捕获 尽 可 能 多 的 错误 ) 。 

需要 注意 的 是 : 循环 有 一 个 隐 式 的 “了 f" , 它 用 于 检测 是 否 达到 循环 终止 条 件 。 因 此 ,循环 也 包 
含 分 支 语句 。 当 我 们 看 到 代码 中 的 分 支 语句 , 首先 要 考虑 的 问题 是 ,“ 我 们 是 否 已 经 覆盖 (测试 ) 
了 所 有 分 支 ?" 令 人 惊讶 的 是 , 对 于 实际 代码 , 杆 盖 所 有 分 支 并 不 总 是 可 行 的 (因为 在 实际 代码 中 ， 
根据 需要 , 一 个 函数 可 能 被 其 他 函数 调用 , 但 调用 并 不 是 所 有 情况 下 都 有 必要 进行 的 ) 。 因 此 , 对 
于 测试 人 员 来 说 , 一 个 更 一 般 的 问题 是 ,“ 你 所 要 求 的 代码 覆盖 率 是 多 少 "?” 答案 最 好 是 “我 们 测 
试 大 部 分 分 支 ", 然后 解释 为 什么 余下 的 分 支 很 难 测试 。100% 的 分 支 覆 盖 只 是 理想 的 情况 。 
26. 3.4 系统 测试 

重要 系统 的 测试 是 一 项 技术 性 工作 。 例 如 , 对 电话 系统 的 计算 机 控制 子 系统 进行 测试 ， 就 需 
要 在 放置 了 许多 机 架 式 计算 机 的 专门 机 房 中 进行 , 通过 模拟 数 万 人 的 通话 来 测试 控制 系统 。 这 种 
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试 系统 本 身 的 价值 就 达到 数 百 万 美元 , 而 且 需 要 非常 熟练 的 工程 师 团队 来 实施 测试 。 而 电话 系 
统一 旦 投入 使 用 , 其 主要 的 电话 交换 机 需要 在 持续 运行 20 年 的 时 间 内 最 多 停机 20 分 钟 (包括 各 
种 原因 ， 如 停电 、 水 灾 、 地 震 等 )。 我 们 不 会 深入 讨论 这 一 问题 ， 比 起 解决 这 个 问题 , 教会 一 个 物 
理 系 新 生计 算 火 星 探 测 器 的 方向 修正 量 会 更 容易 些 。 但 我 们 会 给 你 介绍 一 些 思想 , 这些 思 想 对 于 
测试 一 个 较 小 的 系统 或 者 理解 更 大 系统 的 测试 会 有 所 帮助 。 

首先 ， 请 记 住 测试 的 目的 是 发 现 错误 ， 特别 是 那些 可 能 频繁 发 生 和 很 严重 的 错误 。 编 写 和 运 
行 大 量 的 测试 不 是 一 件 简单 的 工作 。 它 要 求 测试 人 员 要 对 待 测 系 统 有 一 定 的 理解 。 与 单元 测试 
相 比 , 系统 测试 的 有 效 性 更 依赖 于 应 用 程序 的 相关 知识 (领域 知识 ) 。 开 发 一 个 系统 不 仅仅 要 用 到 
编程 语言 和 计算 机 科学 知识 , 还 需要 对 应 用 领域 和 用 户 的 了 解 。 这 也 是 激励 我 们 从 事 编 程 工作 的 
重要 原因 之 一 : 我 们 可 以 接触 到 许多 有 趣 的 应 用 程序 , 认识 很 多 有 趣 的 人 。 

一 个 完整 的 待 测 系 统 可 能 由 许多 组 成 部 分 (单元 ) 构 成 , 其 构造 可 能 会 花费 很 长 时 间 。 因 此 ， 
我 们 需要 在 开发 过 程 中 不 断 进行 测试 , 一 个 可 行 的 策略 是 : 在 完成 所 有 单元 测试 之 后 , 对 于 大 量 
系统 测试 , 每 天 只 做 一 次 (经 常 是 在 晚上 开发 人 员 睡 觉 的 时 候 ) 。 在 这 个 过 程 中 , 回归 测试 是 一 项 
关键 工作 。 最 可 能 发 生 错误 的 地 方 是 新 加 入 的 代码 和 以 前 发 现 过 错误 的 代码 。 因 此 , 重新 运行 旧 
的 测试 集 ( 回归 测试 ) 是 非常 必要 的 。 如 果 不 这 样 做 , 一 个 大 系统 永远 也 不 会 达到 稳定 状态 。 因 为 
在 我 们 消除 旧 错 误 的 同时 ,也 可 能 引入 新 错误 。 

注意 ， 当 修正 错误 的 时 候 , 意外 地 引入 一 些 新 的 错误 是 很 正常 的 。 但 我 们 希望 新 错误 的 数量 低 
于 已 排除 的 错误 的 数量 , 而 且 新 错误 的 严重 程度 也 低 于 老 的 错误 。 然 而 , 至 少 在 重新 进行 回归 测试 ， 
并 对 新 代码 进行 测试 之 前 , 我 们 必须 假定 系统 是 有 问题 的 (我 们 的 错误 修正 工作 引起 了 问题 ) 。 

26. 3. 4.1 测试 图 形 用 户 乔 面 

设想 你 坐 在 屏幕 前 面 , 通过 一 个 精致 的 图 形 用户 界 面 系统 地 测试 程序 。 我 应 该 在 哪里 点 击 鼠 
标 ? 以 什么 顺序 点 击 ? 我 应 该 输入 什么 值 ? 以 什么 顺序 输入 ? 对 于 一 个 大 程序 来 说 , 想 搞 清楚 这 
些 问题 是 没什么 希望 的 。 因 为 可 能 性 实在 太 多 , 或 许 我 们 可 以 考虑 雇 一 群 铝 子 随机 地 在 屏幕 上 乱 
吸 ( 它 们 和 干 这 个 工作 是 为 了 得 到 食物 !) 。 雇 用 一 群 “ 普 通 的 新 手 ”, 看 着 他 们 如 何 “ 乱 吸 ” ， 其 实 并 
不 罕见 , 而 且 还 是 很 必要 的 , 但 这 不 是 系统 化 的 测试 策略 。 任 何 实际 的 测试 方案 都 要 包含 一 些 可 
重复 的 测试 , 这 通常 意味 着 与 应 用 程序 间 的 接口 设计 要 绕 过 图 形 用 户 界 面 。 

那么 为 什么 还 要 让 人 坐 在 GUI 程序 前 “ 乱 吸 " 呢 ? 原因 很 简单 , 用户 可 能 会 是 孤僻 的 、 笨 拙 
的 、 幼稚 的 、 世 故 的 或 急躁 的 人 , 测试 人 员 不 可 能 预见 到 用 户 的 所 有 动作 。 即 使 系统 已 经 经 过 最 
好 的 、 最 系统 的 测试 , 我 们 仍然 需要 真实 的 人 来 试用 系统 。 经 验 表明 ,即使 是 最 有 经 验 的 设计 者 、 
实现 人 员 和 测试 人 员 , 也 可 能 预计 不 到 实际 系统 用 户 的 可 能 行为 。 有 一 个 程序 员 的 谚语 ,“ 当 你 
建立 起 一 个 万 无 一 失 的 系统 的 时 候 , 大 自然 会 创造 一 个 更 傻 的 傻瓜 来 破坏 它 ”。 

因此 , 理想 情况 下 ,GUI 只 是 调用 一 些 定 义 明确 的 “ 主 程 序 ” 的 接口 。 也 就 是 说 ，GUI 仅仅 提供 WO 
操作 , 任何 复杂 的 处 理 都 与 VO 分离。 这 表示 我 们 可 以 提供 不 同 的 ( 非 图 形 ) 接 口 ,如 左下 图 所 示 。 

这 样 , 在 做 单元 测试 的 时 候 , 我 们 可 以 为 “ 主 程序 ”编写 或 生成 脚本 , 就 像 做 单元 测试 那样 
(参见 26. 3.2 节 )。 这 样 我 们 就 可 以 将 “ 主 程序 ”的 测试 与 GUI 分 离 ， ns 
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有 趣 的 是 , 这 样 我 们 还 可 以 半 系 统 化 地 测试 GUI: 我 们 可 以 使 用 文本 VO 来 运行 脚本 , 然后 通过 
GUI 观察 效果 (假设 我 们 将 主 程序 的 输出 同时 发 送 给 CUI 和 文本 0 接口 )。 更 进一步 , 在 测试 
GUI 时, 我 们 可 以 绕 过 “ 主 程序 ”: 提供 一 个 文本 命令 , 能 通过 一 个 小 的 文本 一 一 GUI 命令 “翻译 
器 直接 发 送 给 CUI: 


测试 输出 





上 述 内 容 显示 了 关于 “好 的 测试 ”的 两 个 重要 观点 : 

。 系统 的 各 组 成 部 分 应 该 ( 尽 可 能 地 ) 能 够 独立 测试 。 只 有 拥有 清晰 的 接口 定义 的 “单元 ” 才 

能 单独 测试 。 

。 测试 应 该 ( 尽 可 能 地 ) 可 重复 。 人 工 参与 的 测试 很 难 重复 。 
这 也 是 我 们 所 提 及 的 “为 测试 而 设计 ”的 例子 : 某 些 程序 要 比 其 他 程序 容易 测试 得 多 ,如 果 我 们 在 
设计 的 时 候 就 考虑 测试 , 就 可 以 构建 出 组 织 更 为 良好 、 更 易 测试 的 系统 (参见 26. 2 节 )。 组 织 更 
为 良好 是 什么 意思 ? 请 看 右 图 。 这 个 图 明显 比 前 面 的 图 要 简单 。 在 开始 构造 
系统 时 ,不 需要 考虑 太 多 , 在 需要 与 用 户 通信 的 地 方 , 简单 使 用 GUI 库 就 可 以 
了 。 这 可 能 比 我 们 预想 的 包括 文本 和 图 形 VO 的 程序 代码 量 更 少 。 那 么 , 如 果 
我 们 的 程序 使 用 显 式 的 用 户 界面 , 并 有 更 多 的 模块 , 是 否 能 比 GUI 代码 到 处 散 
布 的 程序 组 织 得 更 好 呢 ? 

为 了 实现 两 种 用 户 界面 , 我 们 需要 仔细 定义 “ 主 程序 ”与 VO 间 的 接口 。 实 际 上 , 我 们 需要 定 
义 一 个 通用 的 V0 接口 层 (类 似 于 我 们 用 来 独立 测试 GUI 的 “翻译 器 ” ) ,如 下 图 所 示 。 我 们 已 经 看 
过 这 方面 的 例子 了 : 第 13 ~ 16 章 中 的 图 形 界面 类 。 它们 将 厂 
“ 主 程序 ”( 即 你 写 的 代码 ) 与 “现成 的 ”GUI 系统 : FLTK、Win- 
dows 、Linux 的 GUI 等 分 离 。 采 用 这 种 设计 , 我 们 可 以 使 用 任何 
LO 系统 。 

这 一 点 很 重要 吗 ? 我 想 的 确 是 的 。 首 先 , 它 有 助 于 测试 , 没 
有 系统 化 的 测试 就 很 难 有 严格 的 正确 性 。 其 次 , 它 带 来 可 移植 性 。 考 虑 如 下 场景 : 你 在 一 个 小 公司 
工作 , 因为 你 喜欢 苹果 公司 的 电脑 , 所 以 你 的 程序 是 在 苹果 计算 机 上 开发 的 。 现 在 , 你 的 公司 逐渐 
发 展 起 来 了 。 你 发 现 你 的 大 部 分 潜在 客户 使 用 的 是 Windows 或 非 Mac 的 Linux 系统 ,你 该 怎么 办 ? 
如 果 使 用 “简单 "组织 方 式 的 话 ，( 萤 果 的 Mac) GUI 命令 会 散布 在 你 的 代码 的 各 个 地 方 ; 你 必须 重 
写 所 有 这 些 代 码 。 这 是 可 以 接受 的 , 因为 程序 可 能 隐藏 有 许多 错误 ( 这 依赖 于 专门 的 测试 ), 重 写 
时 可 以 修正 这 些 错 误 。 但 是 , 你 可 以 考虑 另 一 种 方法 , GUI 和 “ 主 程序 ”相对 分 离 ( 可 以 简化 系统 
化 测试 ) 。 这 样 ， 当 引入 新 的 GUI 界面 时 ， 只 需 简单 地 将 其 连接 到 接口 类 (图 中 的 “翻译 器 ”) 就 可 
以 了 , 大 部 分 代码 都 无 需 改 变 : 





- 带 有 图 形 用 户 
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实际 上 , 这 种 设计 是 一 个 使 用 显 式 的 “ 瘦 " 接 口 显 式 分 隔 程序 模块 的 典型 例子 。 它 与 12.4 节 中 
“ 层 ” 的 概念 类 似 。 测 试 工作 强烈 要 求 程 序 能 够 清晰 地 划分 为 若干 部 分 (每 个 部 分 都 有 相应 的 接 
口 , 我 们 可 以 用 来 进行 测试 ) 。 
26. 3.5 测试 类 

从 技术 上 说 , 类 的 测试 属于 单元 测试 。 但 是 ,既然 类 包括 了 若干 成 员 函 数 和 声明 , 类 的 测试 
也 可 以 看 做 系统 测试 。 如 果 我 们 所 测试 的 是 基 类 , 这 一 点 更 为 明显 , 我 们 不 得 不 考虑 不 同上 下 文 
(对 应 不 同 的 派生 类 ) 。 下 面 是 14. 2 节 中 的 Shape 类 : 


class Shape{ /deals with color and style, and holds sequence of jines 
public: 
void draw!{) const; 1 deal with color and draw lines 
virtual void move(int dx, int dy);  // move the shape +=dx and +=dy 


void set_color(Color cob); 
Color color() const; 


void set_style(Line_style sty); 
Line_style style() const; 


void set_fill_color(Color col); 
Color fill_color() const; 


Point point(int i) const; // read-only access to points 
int number_of_points() const; 


virtual ~Shape() {} 
protected: 
Shape(); 
virtual void draw_lines{) const; // draw the appropriate jines 
void add(Point p); /add p to points 
void set_point(int i,Point p); H points[i]=p; 
private: 
vector<Point> points; // not used by all shapes 


Color jcolor;  // color for lines and characters 
Line_style Is; 
Colorfcolor; /fill color 


Shape(const Shape&); / prevent copying 

Shape& operator=(const Shape&); 
六 
我 们 应 该 怎么 测试 它 呢 ?让 我 们 先 考虑 一 下 Shape 与 bingary_search 的 不 同 在 哪里 (从 测试 人 员 的 
角度 出 发 ) : 

。 Shape 有 若干 晴 数 。 

。 一 个 Shape 可 以 有 多 个 状态 (我 们 可 以 增加 点 、 改 变 颜色 等 ); 这 也 意味 着 对 一 个 函数 的 改 

变 会 影响 到 其 他 函数 的 行为 。 

。 Shape 有 虚 函 数 ， 即 Shape 的 行为 依赖 于 其 派生 类 (如 果 有 的 话 )。 

。 Shape 不 是 一 个 算法 。 

。 对 Shape 的 改变 会 显示 在 屏幕 上 。 
最 后 一 点 非常 糟糕 。 这 意味 着 我 们 不 得 不 让 一 个 人 始终 盯 着 屏幕 ， 查 看 Shape 的 行为 是 否 像 我 们 
所 希望 的 那样 。 这 不 利于 实现 系统 的 、 可 重复 的 、 可 负担 的 测试 。 正 如 26. 3.4. 1 节 中 所 说 , 我 们 
要 尽力 避免 这 种 情况 的 发 生 。 不 过 , 现在 我 们 假定 有 一 个 警觉 的 检测 者 一 直 盯 着 屏幕 ， 查 看 屏幕 
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上 的 显示 是 否 偏离 了 我 们 的 要 求 。 

注意 一 个 重要 的 细节 : 一 个 用 户 可 以 增加 点 , 但 是 不 能 删除 它们 。 用 户 或 一 个 Shape 可 以 读 
点 的 信息 , 但 不 能 改变 它们 。 从 测试 者 的 观点 来 看 , 任何 不 能 改变 (或 至 少 假定 不 能 改变 ) 的 东西 
都 有 助 于 我 们 的 工作 。 

那么 我 们 能 测试 什么 , 不 能 测试 什么 呢 ? 为 了 测试 Shape, 必须 对 其 派生 类 进行 独立 和 组 合 
测试 。 但 是 , 为 了 测试 Shape 对 其 特定 派生 类 是 否 工作 正常 , 还 必须 测试 这 个 派生 类 , 这 大 大 增 
加 了 工作 量 。 | 

我 们 注意 到 Shape 的 状态 ( 值 ) 主要 是 由 4 个 成 员 定义 的 : 


vector<Point> points; 

Colorlcolor;  //color for lines and characters 
Line_style Is; 

Color fcolor;  / fill color 


对 于 一 个 Shape, 我 们 能 做 的 就 是 尝试 改变 这 些 成 员 , 然后 观察 效果 。 幸 运 的 是 , 改变 数据 成 员 的 
唯一 方式 是 通过 成 员 哺 数 定义 的 接口 。 
最 简单 的 Shape 是 Line, 因此 , 我 们 (以 最 简单 的 方式 ) 创建 一 个 Line, 然后 尝试 所 有 可 能 的 改变 : 


Line In(Point(10,10) Point(100, 100)); 
ln.draw(); // see if it appears 


// check the points: 

if (In.number_of_points() != 2) cerr << "wrong number of points"; 
if (In.point(0)!=Point(10,10)) cerr<< "wrong point 1"; 

if (In.point(1)!=Point(100,100)) cerr<< "wrong point 2"; 


for (int i=0; i<10; ++i) { // see if it moves 
in.move(i+5,i+5)，》 
in.draw()， 


} 


for (int i=0; i<10; ++i) { // see if it moves back to where it started 
In.move(i—5,i~5); | 
In.draw(); 

} 

if (point(0)!=Point(10,10)) cerr<< "wrong point 1 after move"; 

if (point(1)!=Point(100,100)) cerr<< "wrong point 2 after move"; 


for (int i = 0; i<100; ++i) { //see if the color changes correctly 
in.set_color(Color(i*100)); 


if (In.color() 1= i*100) cerr << "bad set_color"; 
In.draw(); 


} 


for (int i = 0; i<100; ++i) { // see if the style changes correctly 
ln.set_style(Line_style(i*5)); 
if (In.style() {= i*5) cerr << "bad set_style"; 
in.draw(); 


} 
理论 上 , 这 个 测试 能 够 测试 Line 的 创建 、 移 动 、 改变 颜色 和 风格 等 功能 。 实 际 上 , 我 们 需要 更 仔 
细 地 (和 全 面 地 ) 选 择 测试 用 例 , 就 像 我 们 在 测试 binary_search 时 所 做 的 那样 。 而 且 , 我 们 可 以 确 
定 从 文件 中 读 取 测试 描述 是 一 种 更 好 的 方案 , 这 样 我 们 也 能 获得 一 种 更 好 的 报告 错误 的 方法 。 
此 外 , 我 们 发 现 没 有 人 能 够 跟 上 Shape 的 快速 变化 , 这 里 有 两 个 替代 方案 , 我 们 可 以 
。 把 程序 的 运行 速度 降下 来 , 这 样 人 们 能 够 跟 上 Shape 的 变化 。 
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。 找到 Shape 的 一 种 描述 形式 , 能 通过 程序 来 读 取 和 分 析 。 
我 们 几乎 完全 没有 测试 add( Point), 对 此 , 我 们 可 以 使 用 Open_polyline 来 进行 测试 。 
26. 3. 6 . 寻找 不 成 立 的 假设 

binary_search 的 规范 明确 要 求 输入 序列 必须 是 有 序 的 。 这 个 条 件 让 我 们 不 能 利用 许多 单元 测 
试 的 技巧 。 但 这 显然 为 编写 糟糕 代码 提供 了 机 会 , 我 们 已 经 设计 的 测试 (系统 测试 除外 ) 不 能 发 现 
其 中 的 错误 。 我 们 是 否 能 利用 对 系统 “单元 ”( 函数 、 类 等 ) 的 理解 来 设计 更 好 的 测试 呢 ? 

不 幸 的 是 , 最 简单 的 答案 是 否定 的 。 作 为 纯粹 的 测试 者 , 我 们 不 能 改变 代码 , 而 只 能 检查 是 
否 违 反 了 接口 的 要 求 (前 置 条 件 ), 我 们 应 该 在 每 次 调用 前 进行 前 置 条 件 检 查 , 或 者 实现 为 函数 的 
一 部 分 (参见 5.5 节 )。 但 是 ,， 只 有 待 测 代码 是 我 们 自己 编写 的 , 我 们 才 可 以 插入 这 样 的 测试 代 
码 。 如 果 我 们 是 测试 人 员 , 并 且 代 码 的 编写 者 会 听从 我 们 的 要 求 (这 并 不 总 能 实现 ) , 我 们 可 以 告 
诉 他 们 还 未 测试 的 内 容 , 并 要 求 他 们 确保 这 些 内 容 被 测试 。 

回 到 binary_search 的 例子 : 我 们 不 能 检测 输入 序列 [first: last ) 是 否 是 一 个 合法 序列 以 及 是 否 


有 序 ( 参 见 26.3.2.2 节 )。 但 是 ,我们 可 以 用 下 面 的 函数 来 检查 : 
tempiate<class lter, class T> 
booi b2(lter first, iter last, const T& value) 
{ 
/ check if {ffirst:last) is a sequence: 
if (last<first) throw Bad_sequence(); 


// check if the sequence is ordered: 
if (2<last~first) 
for (lter p = first+1; p<last; ++p) 
if (*p<*(p—1)) throw Not_ordered!(); 


/alls OK, call binary_search: 
return binary_search(first,last,value); 


} 
现在 ,bingary_search 中 没有 包含 这 些 测试 代码 , 原因 包括 ， 
。 比较 运算 last < first 不 能 用 于 前 向 迭代 器 ; 例如 ，std: :list 的 选 代 器 就 没有 < (参见 附录 
B. 3.2) 。 通常, 没有 一 个 真正 好 的 办 法 来 测试 有 一 对 选 代 器 定义 了 一 个 合法 的 序列 (可 以 
从 first 开始 迭代 , 期 待 最 终 能 遇 到 last, 但 这 不 是 一 个 好 的 检测 方法 )。 
。 通过 扫描 整个 序列 来 确定 序列 是 否 有 序 的 代价 远 超过 执行 binary_search 本 身 ( binary 
search 的 目的 不 是 盲目 地 遍历 整个 序列 去 查找 某 个 值 , 这 是 std :: find 的 做 法 ) 。 
那 我 们 能 做 什么 呢 ? 我 们 可 以 在 测试 中 用 bz 来 兰 代 binary_search( 只 在 用 随机 访问 选 代 器 调用 bina- 
ry_seareh 时 进行 替换 ) 。 此 外 ,如 果 允 许 的话 , 我 们 可 以 要 求 binary_search 的 编写 者 插入 测试 代码 : 


template<class Iter, class T> // warning: contains pseudo code 
bool binary_search {lter first, iter last, const T& value) 
{ 
if (test enabied) { 
if (lter is a random access iterator) { 
1// check if {first:last) is a sequence: 
if (last<first) throw Bad_sequence(); 
} . 


// check if the sequence is ordered: 
if (first!=last) { 
lter prev = first; 
for (lter p = ++first; pi=last; ++p, ++ prev) 
if (*p<*prev) throw Not_ordered(); 





} 
} 


I now do binary_search 
} 
其 中 ,“test enabled” 的 含义 依赖 于 测试 是 如 何 (为 特定 方式 组 织 的 专用 系统 ) 安 排 的 , 因此 我 们 把 
它 设 为 伪 代 码 : 在 测试 你 自己 的 代码 时 , 你 就 可 以 用 一 个 test_enabled 变量 来 代 兰 。 我 们 也 把 ”Iter 
is a random access iterator "检测 作为 伪 代 码 , 因为 我 们 没有 人 解释” 壕 代 器 特征 ”( iterator traits ) 是 什 
么 。 如 果 你 真 的 需要 做 这 个 检测 , 你 可 以 在 高 阶 C++ 书籍 中 查找 迭代 器 特征 的 相关 内 容 。 


26. 4 测试 方案 设计 


在 开始 编写 程序 的 时 候 , 我 们 当然 希望 它 最 终 是 完整 的 、 正 确 的 。 我 们 知道 , 为 了 达成 这 一 目 
标 , 必须 进行 测试 。 因 此 , 从 编写 程序 的 第 一 天 起 , 我 们 在 设计 中 就 要 考虑 正确 性 和 测试 。 实 际 上 ， 
许多 优秀 的 程序 员 都 有 个 口号 " 早 测 试 , 经 常 测试 ”， 而且, 他们 不 会 在 考虑 好 代码 将 来 如 何 测试 之 
前 , 就 急于 动手 编写 。 及 早 考虑 测试 问题 有 助 于 避免 发 生 在 早期 的 错误 (也 有 助 于 以 后 发 现 错误 )， 
我 们 赞成 这 种 程序 设计 哲学 。 一 些 程序 员 甚至 在 编写 程序 单元 之 前 就 编写 好 了 单元 测试 。 

26. 3.2.1 节 和 26. 3.3 节 中 的 例子 解释 了 这 些 关键 的 思想 ， 

。 使 用 定义 良好 的 接口 , 这 样 你 可 以 测试 这 些 接口 的 使 用 。 

e 为 各 种 操作 定义 文本 描述 方式 , 这 样 它们 就 可 以 被 存储 、 分 析 和 重 放 。 这 也 包括 输出 

操作 。 

。 在 调用 代码 中 嵌入 对 未 检查 假设 (断言) 的 检测 ,以 便 在 系统 测试 前 捕获 错误 参数 。 

。 最 小 化 依赖 性 , 并 且 保 持 各 种 依赖 关系 清晰 可 见 。 

。 有 一 个 清晰 的 资源 管理 策略 。 

从 哲学 上 讲 , 这 些 思想 可 以 看 做 是 单元 测试 技术 能 很 好 地 应 用 于 子 系统 和 整个 系统 的 保证 。 

如 果 不 考 虑 性 能 , 我 们 可 以 始终 进行 未 检查 假设 (要 求 、 前 置 条 件 等 ) 的 检测 。 但 是 , 程序 通 
常 不 包含 这 部 分 代码 , 这 是 有 原因 的 。 例 如 , 我 们 看 到 检查 输入 序列 是 否 有 序 比 binary_search 本 
身 还 要 复杂 , 并 且 代价 更 高 。 因 此 , 设计 一 个 系统 能 允许 我 们 根据 需要 选择 性 地 打开 /关闭 这 种 
检测 ， 是 一 个 好 想法 。 对 大 多 数 系统 来 说 , 在 最 终 ( 发布 ) 版 本 中 留 下 相当 多 代价 比较 低 的 检查 代 
码 是 个 好 主意 : 因为 在 一 些 “ 不 可 能 ”的 情况 发 生 的 时 候 , 我 们 更 希望 通过 一 个 明确 的 错误 信息 来 
了 解 情况 ， 而 不 是 一 个 简单 的 系统 角 溃 。 


26.5 调试 


调试 是 一 种 技术 , 也 是 一 种 态度 。 显 然 , 态度 更 重要 。 请 回顾 一 下 第 5 章 , 注意 一 下 调试 与 
测试 的 不 同 。 这 两 者 都 捕获 错误 , 但 是 调试 更 具 专 门 性 , 重点 关注 排除 已 知 错误 和 实现 新 特性 。 
任何 一 种 能 让 调试 更 像 测 试 的 方法 我 们 都 会 去 尝试 。 要 说 我 们 喜欢 测试 确实 有 些 夸 张 , 但 是 我 们 
确实 讨厌 调试 。 及 早 进行 单元 测试 , 在 设计 时 考虑 测试 , 都 有 助 于 最 小 化 调试 的 工作 量 。 


26.6 性 能 


对 一 个 有 用 的 程序 来 说 , 仅仅 满足 正确 性 是 不 够 的 。 即 使 假定 有 足够 的 设备 条 件 供 程序 使 
用 , 它 也 必须 拥有 一 定 的 性 能 。 一 个 好 的 程序 应 该 是 “效率 足够 高 的 ”， 即 它 能 够 在 给 定 的 资源 条 
件 下 , 在 可 接受 的 时 间 内 得 到 结果 。 但 要 注意 的 是 绝对 的 效率 并 不 是 我 们 的 首要 目标 。 一 种 固有 
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的 认识 是 运行 更 快 的 程序 可 能 会 给 开发 工作 带 来 麻烦 ,因为 它 会 导致 复杂 的 代码 (可 能 包含 更 多 
的 错误 、 调 试 工作 量 等 大 ) , 使 维护 (包括 移植 和 性 能 调 优 ) 工作 更 困难 、 代 价 更 高 。 

那么 , 我们 怎么 才能 知道 一 个 程序 (或 程序 单元 ) 是 “效率 足够 高 的 " 呢 ? 理论 上 讲 , 我 们 是 不 可 
能 知道 的 。 而 且 很 多 程序 运行 的 硬件 都 非常 快 , 使 得 这 个 问题 不 那么 关键 。 我 们 曾经 看 到 过 这 种 情 
况 : 为 了 更 好 地 检测 系统 发 布 后 所 发 生 的 错误 (即使 是 最 好 的 代码 ， 当 它 与 其 他 代码 一 起 工作 时 , 错 
误 也 会 发 生 ), 有 的 正式 产品 会 以 调试 模式 编译 (虽然 这 可 能 导致 运行 速度 比 发 布 模式 慢 25 倍 ) 。 

因此 ,对 问题 “效率 是 否 足够 高 "的 答案 是 :“ 测 量 感 兴趣 的 测试 用 例 花费 多 长 时 间 ”。 在 这 
里 , 你 显然 要 充分 了 解 最 终 用 户 “ 感 兴趣 ”的 是 什么 , 以 及 他 们 对 于 这 些 “ 感 兴趣 ”的 测试 用 例 可 接 
受 的 最 长 运行 时 间 是 多 长 。 逻 辑 上 , 我 们 可 以 用 秒表 进行 计时 , 并 检查 所 花费 的 时 间 是 否 合理 。 
在 实际 中 , 我 们 可 以 使 用 一 些 函数 , 例如 clock( ) (参见 26. 6. 1 节 ) 来 完成 计时 功能 。 而 且 , 我 们 
还 可 以 自动 比较 测试 所 花费 的 时 间 与 预先 估计 的 合理 时 间 。 一 种 替代 方法 (或 者 与 前 一 种 比较 同 
时 做 ) 是 , 记 下 测试 花费 的 时 间 , 与 以 前 的 测试 进行 比较 。 这 是 一 种 性 能 回归 测试 。 

一 些 最 糟糕 的 性 能 bug 是 由 糟糕 的 算法 引起 的 , 这 种 问题 也 可 以 通过 测试 发 现 。 使 用 大 数据 
集 进 行 测试 的 原因 之 一 就 是 要 暴露 低 效 的 算法 。 例 如 , 假设 有 一 个 应 用 程序 求 矩 阵 每 行 元 素 之 和 
(使 用 第 24 章 中 的 Matrix 库 ), 下面 是 某 人 提供 的 相应 函数 ; 

double row_sum(Matrix<double,2> m, int n); /sum of elements in mIn] 


现在 ,， 有 人 使 用 这 个 肾 数 生成 一 个 vector, vL nj 保存 前 n 行 元 素 之 和 : 
double row_accum(Matrix<double,2> m, intn) /sum of elements in mI[O:n) 


{ 

double s = 0; 

for (int i=0; i<n; ++i) s+=row_sum(m,i); 
return s; 


} 


/ compute accumulated sums of rows of m: 
vector<double> v; 
for (int i = 0; i<m.dim10; ++i) v.push_back(row_accum(m,i+D)); 


设想 这 个 函数 是 单元 测试 的 一 部 分 , 或 者 是 系统 测试 所 测试 的 应 用 程序 的 一 部 分 。 不 管 在 哪 种 情况 
下 , 只 要 和 矩阵 足够 大 , 你 都 会 发 现 一 些 奇怪 的 现象 : 基本 上 , 程序 所 需要 的 时 间 与 m 的 元 素数 目的 平 
方 成 正比 。 为 什么 呢 ? 因 为 函数 先是 求 第 一 行 所 有 元 素 之 和 , 然后 再 求 第 二 行 所 有 元 素 之 和 (再 次 
访问 了 第 一 行 所 有 元 素 ), 接着 求 第 三 行 所 有 元 素 之 和 (再 次 访问 了 前 两 行 的 所 有 元 素 ) , 依 此 类 推 。 

如 果 你 认为 这 个 例子 不 够 好 , 那么 想象 一 下 如 果 row_sum( ) 需要 通过 访问 数据 库 读 取 数 据 的 
话 , 会 发 生 什么 吧 。 读 硬盘 会 比 读 取 主 存 慢 几 千 倍 。 

现在 , 你 可 能 会 抱怨 “ 没 人 会 写 出 这 么 思春 的 代码 ”! 抱 妇 ,我 们 见 过 更 糟 的 。 当 隐藏 在 应 用 
程序 代码 之 中 时 , 糟糕 的 算法 (从 性 能 的 角度 来 看 ) 是 很 难 被 发 现 的 。 当 你 第 一 次 看 这 段 代码 的 时 
候 , 你 注意 到 性 能 问题 了 吗 ? 除非 你 专门 关注 于 这 类 问题 ， 人 出 关 国生 作 尖 信人 珊 风 。 下 面 是 一 
个 来 自 真实 的 服务 程序 的 例子 : 

for (int i=0; i<strlen(s); ++i) {/* do something with sli] */)} 
一 般 情况 下 , s 是 一 个 包含 2 万 个 字符 的 字符 串 。 

并 不 是 所 有 的 性 能 问题 都 是 由 糟糕 的 算法 导致 的 。 实 际 上 (正如 我 们 在 26.3.3 市 中 指出 
的 ) , 我 们 所 编写 的 大 部 分 代码 不 能 归 类 为 特定 的 算法 。 一 般 来 说 , 这 些 “ 非 算法 "的 性 能 问题 都 
被 归 类 为 “糟糕 的 设计 ”。 具 体 包括 : 

。 信息 的 重复 计算 (例如 ,上 面 的 矩阵 行 求 和 问题 ) 。 
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。 重复 检查 (例如 , 在 循环 中 每 次 都 检查 数据 的 索引 , 或 者 在 函数 间 传 递 参数 时 ， 即 便 参 数 
没有 改变 , 也 重复 检查 它 ) 。 

es 重复 访问 硬盘 (或 网 络 ) 。 
注意 重复 一 词 。 显 然 , 我 们 是 指 “ 不 必要 的 重复 ”, 但 是 , 除非 你 重复 很 多 次 , 这 类 操作 不 会 对 性 
能 产生 显著 影响 。 对 于 函数 参数 和 循环 变量 , 我 们 当然 要 仔细 检查 。 但 是 , 如 果 对 同一 个 值 进行 
一 百 万 次 检查 的 话 , 这 种 宛 余 检查 可 能 会 伤害 性 能 。 如 果 通 过 测试 , 我 们 发 现 性 能 受到 了 影响 ， 
我 们 就 要 看 看 是 否 可 以 消除 这 些 重 复 操作 。 然 而 , 除非 你 认为 性 能 是 个 关键 问题 , 否则 不 要 轻易 
删除 代码 。 过 早 的 优化 反而 可 能 浪费 时 间或 引入 更 多 错误 。 
26. 6.1 计时 

你 怎么 才能 知道 一 段 代 码 是 否 足 够 快 呢 ? 你 如 何 确定 一 个 操作 的 执行 时 间 呢 ? 在 大 部 分 情 
况 下 , 你 可 以 简单 地 通过 看 表 来 达到 目的 (秒表 、 挂钟 或 闹钟 ) 。 虽 然 这 种 方法 不 科学 , 也 不 准确 ， 
但 是 如 果 这 种 方法 不 可 行 的 话 (意味 着 你 没有 来 得 及 看 清 花费 了 多 少时 间 ) , 通常 你 就 可 以 下 结 
论 : 程序 足够 快 。 但 纠缠 于 性 能 问题 并 不 是 一 个 好 的 思路 。 

如 果 你 希望 获得 精确 时 间 , 或 者 你 不 能 坐 在 那里 看 秒表 的 话 , 你 就 需要 计算 机 来 帮助 你 。 计 
算 机 可 以 获得 准确 的 运行 时 间 。 例 如 , 在 UNIX 系统 中 ,只 需要 在 所 运行 命令 前 加 上 time 前 组 ， 
系统 就 会 显示 所 花费 的 时 间 。 你 可 以 用 time 来 查看 编译 一 个 C++ 源 文件 x. cpp 需要 多 长 时 间 。 
通常 , 你 的 编译 指令 如 下 : 

g++ X.Cpp 
如 果 要 查看 编译 时 间 , 可 以 加 上 time: 

time g++ x.cpp 
上 面 的 指令 将 编译 x. cpp 并 将 所 花费 的 时 间 输 出 到 屏幕 上 。 对 于 小 程序 来 说 ， 这 是 一 种 简单 、 有 
效 的 办 法 。 需 要 记 住 的 是 这 种 方法 需要 多 运行 几 次 , 因为 你 的 计算 机 上 的 “其 他 活动 ”可 能 影响 计 
时 的 准确 性 。 如 果 连 续 三 次 得 到 大 致 相同 的 结果 , 通常 你 就 可 以 信任 这 一 结果 了 。 

但 是 , 如 果 待 测 程序 的 运行 时 间 是 毫秒 级 的 , 应 该 怎么 办 呢 ? 如 果 你 希望 更 准确 地 测量 程序 
的 某 一 部 分 花费 的 时 间 , 应 该 怎么 办 呢 ? 你 可 以 使 用 标准 库 函 数 clock( ) 来 计时 , 下 面 这 个 例子 中 
就 是 采用 这 种 方法 测量 函数 do_something( ) 所 花费 的 时 间 : 


#include <ctime> 
#include <iostream> 
using namespace std; 


int main() 

{ 
int n = 10000000; // repeat do_something() n times 
clock ttf = clock(); / start time 


if (tf == clock_t(—1)) { // clock_t(-1) means “clock() didn4 wo 
Cerr << "sorry, no clock\in™; 
exit(]1); 

} 


for (int i = 0; i<n; i++) do_something0; / timing loop 


clock t 12 = clock(); /end time 
if (12 == clock_t(~1)) { 

Cerr << "sorry, clock overflow\n"; 
exit(2); 
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cout << "do_something() " << n << " times took " 
<< double(t2-t1)/CLOCKS_PER_SEC << " seconds' 
<<" (measurement granularity: " 
<< CLOCKS_PER_SEC << " of a second})n'; 
} 


函数 clock( ) 返 回 值 的 类 型 为 clock_t。 其 中 , 在 做 除法 前 的 显 式 类 型 转换 double ( 记 -t1) 是 必要 
的 ,因为 ，clock_t 可 能 是 整数 。 何 时 用 clock( ) 开始 计时 依赖 于 具体 程序 , 其 目的 是 计量 程序 单 次 
运行 的 起 止 时 间 间 隔 。tl 和 也 是 clock( ) 的 返回 值 , double( 记 -tL)XCLOCKS_PER_SEC 是 以 秒 计 
量 的 两 次 调用 之 间 的 系统 时 间 间 隔 。 你 可 以 在 < ctime > 中 找到 CLOCKS _PER_SEC 的 说 明 ( 每 各 
clock 计数 ”) 。 

如 果 处 理 器 不 支持 clock( ) 或 者 时 间 间 隔 太 长 的 话 ，clock( ) 返 回 clock_t -1)。 

函数 clock( ) 可 以 计量 几 分 之 一 秒 到 几 秒 的 时 间 间 隔 。 例 如 , 如 果 clock_t 是 32 位 有 符号 整数 
并 且 CLOCKS_PER_SEC 是 1000000 的 话 , 我 们 可 以 利用 clock( ) 以 微妙 为 单位 测量 从 0 到 超过 
2000 秒 ( 大 约 半 小 时 ) 的 时 间 间 隔 。 

此 外 , 对 于 任何 一 个 测试 对 象 ， 如 果 你 不 能 连续 三 次 得 到 大 致 相同 的 结果 , 则 这 个 测试 是 不 
可 信 的 。 什 么 是 “大 致 相同 的 结果 " 呢 ? 合理 的 答案 是 “误差 在 10% 以 内 ”。 现 代 计算 机 是 非常 快 
的 : 每 秒 执行 10 亿 条 指令 是 很 普通 的 。 这 意味 着 很 多 程序 的 运行 时 间 很 难 被 测量 , 除非 你 把 某 个 
程序 重复 运行 上 万 次 或 者 它 本 身 确 实 就 很 慢 , 例如 有 写 硬盘 或 访问 互联 网 的 情况 。 对 于 后 者 , 可 
能 我 们 只 需要 运行 重复 几 百 次 就 可 以 了 。 但 是 对 于 如 何 正确 理解 这 些 实验 结果 ,可 能 会 有 一 些 
困难 。 
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必 》 简单 练习 


运行 下 列 binary_search 程序 的 测试 : 
1. 实现 26. 3. 2. 2 节 中 Test 的 输入 操作 符 。 
2. 对 来 目 26. 3 节 的 序列 , 将 测试 描述 补充 完整 , 存 人 文件 中 : 


a) {1,2,3,5,8,13,21} // an “ordinary sequence” 
b) {} 

c) {1} 

d) {1,2,3,4} // even number of elements 


e€) {1,2,3,4,5} // odd number of elements 

f) {t,t,1,1,1,1,1} // all elements equal 

gE) {Ohl 1,1,1,1} // different element at beginning 
h) {0,0,0,0,0,0,0,0,0,0,0,0,0,1 } /{ different eilement at end 


. 基于 26. 3. 1.3 节 的 内 容 , 编写 一 个 程序 , 它 可 以 生成 
a) 一 个 非常 大 的 序列 (你 认为 什么 是 大 , 为 什么 ?) 
b) 十 个 序列 , 每 个 序列 的 元 素 个 数 是 随机 的 
c) 十 个 序列 , 每 个 序列 分 别 包含 0,1 ,2…9 个 随机 数 作为 元 素 ( 但 仍然 有 序 ) 
4. 重复 上 述 测 试 , 但 序列 中 元 素 为 字符 串 , 例如 | Bohr Darwin Einstein Lavoisier Newton TE 六 


<》 思考 题 
1、 制 作 一 个 应 用 程序 的 列表 , 对 每 个 程序 都 给 出 可 能 导 臻 最 严重 后 果 的 bug 的 简单 说 明 。 例 如 , 航班 控制 


(2 
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“和 氏 26 羡 油 斌 611 


程序 一 一 坠 机 : 231 人 死亡 ; 损失 价值 5 亿美 元 的 设备 。 


. 为 什么 我 们 不 直接 证 明 程 序 的 正确 性 呢 ? 
.单元 测试 与 系统 测试 有 什么 不 同 ? 

. 什么 是 回归 测试 ,为 什么 它 很 重要 ? 

. 测试 的 目的 是 什么 ? 


为 什么 binary_search 不 检查 它 的 要 求 ? 


， 如 果 我 们 不 能 检查 到 所 有 错误 , 那么 我 们 应 该 主要 查找 坚 类 错误 ? 
. 在 处 理 数据 序列 时 ,错误 最 可 能 出 现在 代码 的 哪 部 分 ? 

. 为 什么 在 测试 时 候 使 用 大 数值 是 个 好 主意 ? 

. 为 什么 测试 用 例 经 常 以 数据 而 不 是 代码 形式 出 现 ? 

. 为 什么 我 们 要 使 用 大 量 基于 随机 数 的 测试 用 例 ? 什么 时 候 使 用 ? 
为 什么 测试 有 GUI 的 程序 很 国难 

. 为 什么 需要 独立 测试 一 个 “单元 
9 

. 为 什么 测试 一 个 类 要 比 测试 一 个 函数 困难 ? 

. 为 什么 测试 的 可 重复 性 很 重要 ? 

. 当 发 现 一 个 “单元 "依赖 于 未 检查 的 假设 (前 置 条 件 ) 时 , 测试 者 应 该 怎么 办 ? 
. 程序 设计 者 /实现 者 应 该 如 何 做 ,才能 改进 测试? 

. 测试 与 调试 有 什么 不 同 ? 

.什么 时 候 性 能 是 我 们 要 考虑 的 因素 ? 

21. 对 于 如 何 (容易 地 ) 制造 低 性 能 问题 , 给 出 两 个 (或 更 多 ) 例子 。 


全》 术语 


假设 后 置 条 件 训 试 著 盖 沉 盒 测试 
前 置 条 件 测试 工具 分 文 证 明 
测试 clock( ) 回归 时 间 
为 测试 而 设计 资源 使 用 单元 测试 输入 
状态 日 盒 测试 输出 系统 测试 


一》 习题 


1. 使 用 26. 3. 2 节 中 的 测试 用 例 测 试 26. 1 节 中 的 binary_search 算法 程序 。 


.修改 binary_search 的 测试 , 使 它 能 够 处 理 任意 数据 类 型 ,然后 测试 string 序列 和 浮 点 序列 。 
:使 用 接受 比较 操作 参数 的 binary_search 版 本 , 重复 26. 3. 2 节 中 的 练习 。 列 出 引入 额外 的 参数 后 , 可 能 出 


现 的 新 错误 。 


. 设计 一 种 测试 数据 的 格式 , 可 以 让 你 只 需 定义 一 次 数据 序列 , 但 可 以 在 多 个 测试 中 使 用 。 
.在 binary_search 的 测试 集中 加 入 一 个 测试 , 它 能 够 捕获 binary_search 修改 数据 序列 这 种 (不 太 可 能 的 ) 


错误 。 


. 对 第 7 章 的 计算 器 程序 做 一 些 尽 可 能 小 的 改动 , 使 它 能 够 从 文件 输入 数据 , 并 可 以 将 输出 存 人 文件 中 (或 


者 使 用 你 的 操作 系统 的 IO 重 定向 功能 ) 。 然 后 为 它 设计 一 套 可 行 的 综合 测试 。 


. 测试 20.6 市 中 的 “简单 文本 编辑 器 "程序 。 
. 为 第 12 ~15 章 中 的 图 形 界面 库 增加 一 个 文本 界面 。 例 如 , 字符 串 “ Circle( Point(0,1) ,15)” 应 该 生成 一 个 


再 用 Circle( Point(0,1) ,15) 。 使 用 这 个 文本 界面 生成 一 个 “儿童 图 画 ”: 一 个 带 屋顶 的 二 维 房子 , 两 个 窗 
户 和 一 个 门 。 


. 为 图 形 界面 库 增加 一 个 基于 文本 的 输出 格式 。 例 如 ,， 当 调用 Circle( Point(0,1) ,15 ) 时, 一 个 字符 串 “Cir- 


cle(Point(0,1) ,15) ”也 应 被 发 送 到 输出 流 中 。 


10. 使 用 练习 9 中 的 基于 文本 的 界面 为 图 形 界面 库 写 一 个 更 好 的 测试 。 
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11. 测量 26.6 节 中 的 矩阵 求 和 例子 的 时 间 ， 其 中 和 矩阵 是 方 阵 , 维度 分 别 是 100、10 000、1 000 000 和 
10 000 000。 元 索 值 是 [ - 10: 10) 之 间 的 随机 数 。 使 用 一 个 更 有 效 的 算法 ( 非 0(n^2) ) 重 写 程序 , 并 比较 
所 花费 的 时 间 。 
12， 写 一 个 程序 , 它 能 生成 随机 浮 点 数 并 用 std :: sort( ) 对 这 些 数 进行 排序 。 比 较 500 000 个 和 5 000 000 个 
double 值 进行 排序 所 花费 的 时 间 。 
13. 重复 上 一 个 练习 中 的 实验 , 但 使 用 的 是 随机 字符 串 , 长 度 范围 是 [0: 100 ) 。 
. 重复 上 一 个 练习 , 但 是 使 用 map 而 不 是 vector, 这 样 我 们 就 不 需要 进行 排序 了 。 


14 
人 附 言 

作为 程序 员 , 我 们 梦想 能 够 编写 出 第 一 次 运行 就 通过 的 完美 程序 。 但 是 现实 是 残酷 的 : 保证 程序 的 正 
确 性 是 很 困难 的 , 而且 当 我 们 (和 我 们 的 同事 ) 改进 代码 时 ,很 难 使 程序 保持 在 正确 的 状态 。 测 试 , 包括 在 


设计 时 考虑 调试 问题 , 是 保证 我 们 提交 的 系统 真正 正常 运行 的 主要 方法 。 无 论 何 时 ， 当 我 们 在 这 个 高 科技 
时 代 结 束 一 天 工作 的 时 候 , 我 们 真 的 应 该 对 (经 常 被 筷 记 的 ) 测 试 人 员 报 以 善意 。 


[中 
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“C 是 一 种 强 类 型 、 弱 检查 的 程序 设计 语言 ” 





Dennis Ritchie 


本 章 简要 概述 C 语言 及 其 标准 库 , 我 们 假定 读者 已 经 掌握 了 C++ 语言 。 我 们 列 出 C 不 支持 的 C++ 特 
性 , 并 通过 例子 程序 展示 应 对 这 些 缺 失 特 性 。 我 们 还 会 讨论 C 和 C++ 不 兼容 的 地 方 , 以 及 C 和 C++ 的 互 
操作 方式 。 我 们 会 通过 举例 来 说 明 LO、 列表 操作 、 内 存 管 理 和 字符 串 操作 方面 的 C 特性 。 


27.1 C 和 C++: 兄弟 


C 语言 是 由 贝尔 实验 室 的 Dennis Ritehie 设计 和 开发 的 ，Brain Kemighan 和 Dennis Ritchie 合 著 
的 《The C Programming Language/》 一 书 (俗称 "K&R") 使 它 迅 速 普及 。 这 本 书 可 能 是 迄今 为 止 最 好 
的 C 语言 人 门 书籍 和 最 好 的 程序 设计 书籍 之 一 (参见 22.2.5 节 )。C++ 最 初 的 定义 文档 ,是 在 
Dennis Ritchie 的 1980 年 版 C 定义 的 基础 上 修改 而 来 的 。 在 此 之 后 , 两 种 语言 都 有 了 进一步 的 发 
展 。 与 C++ 一 样 , 现在 C 语言 的 标准 制定 也 是 由 ISO 标准 组 织 负责 的 。 

我 们 大 致 上 可 以 将 C 看 做 C++ 的 子 集 。 因 此 , 从 C++ 的 角度 看 , 介绍 C 语言 就 归结 为 两 个 
问题 : 

sC 的 哪些 特性 并 非 C++ 的 子 集 。 

es。 C++ 的 哪些 特性 C 并 不 支持 , 以 及 用 什么 样 的 C 特性 和 技术 可 以 弥补 。 
历史 上 , 现代 C 语言 和 现代 C++ 语言 是 兄弟 关系 , 两 者 都 是 ”经典 C "的 直系 后 裔 。 这 里 的 “经 典 
C" 是 指 Brain Kemighan 和 Dennis Ritchie 的 (The C Programming Language》 第 1 版 中 介绍 的 C 再 加 
上 结构 赋值 和 枚 举 类 型 两 个 特性 : 


1978 


1980 
1985 
1989 


1998 
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在 所 有 的 C 版 本 中 , C89(K&R 第 2 版 ) 目 前 占据 统治 地 位 ,本章 介绍 的 就 是 C89。 目 前 还 有 其 他 
一 些 经 典 C 在 使 用 , C99 也 有 一些 应 用 ,但 只 要 你 掌握 了 C++ 和 C89, 使 用 这 些 不 同 的 “方言 "者 
不 成 问题 。 a : : 

C 和 C++ 都 "出生 "在 新 泽 西 州 来 莉 山 贝尔 实验 室 的 计算 机 科学 研究 中 心 (有 段 时 间 , 我 的 办 
公 室 和 Brain Kermighan 、Dennis Ritchie 的 办 \ 室 吏 隅 着 一 个 走廊 和 几 道 门 ): 






C 和 C++ 的 标准 制定 目前 都 由 ISO 标准 委员 会 负责 。 两 种 语言 都 有 大 量 的 实际 实现 在 使 用 中 。 
现在 的 编译 系统 通常 都 同时 支持 C 和 C++， 通过 编译 选项 或 源 程序 后 级 选择 是 按 哪 种 语言 编译 。 
两 种 语言 比 其 他 任何 语言 都 要 更 普及 。 两 者 最 初 的 设计 目的 和 当前 最 重要 的 应 用 都 是 系统 级 程 
序 设计 , 例如 : : 

。 操作 系统 内 核 

。 设备 驱动 

。 媒人 式 系统 

。 编译 器 

。 通信 系统 - 

等 价 的 C 和 C++ 程 序 在 性 能 上 没有 什么 差异 。 和 

与 C++ 一 样 , C 的 应 用 非常 广泛 。 两 者 合并 计算 的 话 , 其 开发 社 群 应 该 是 地 球 上 最 大 的 软件 
开发 社 群 。 
27. 1.1 C/C++ 兼容 性 

我 们 经 常会 听 到 “C/C++” 这 种 提 法 。 但 是 , 并 不 存在 这 种 语言 , 这 种 提 法 是 无 知 的 表现 。 


我 们 只 在 讨论 C/C++ 兼容 性 问题 , 以 及 论 及 大 的 C/C++ 共享 技术 社 群 时 才 会 用 “C/C++” 的 
说 法 。 

C++ 大 体 上 是 (但 不 完全 是 )C 的 一 个 超 集 。 大 部 分 C 和 C++ 都 有 的 特性 , 其 语义 在 两 种 语 
言 中 也 是 相同 的 , 例外 情况 很 少 。C++ 的 设计 目标 之 一 就 是 “ 尽 可 能 接近 C, 直到 不 能 再 近 ”, 目 
的 在 于 : 

。 易于 两 种 语言 间 的 转换 

。 两 种 语言 的 共存 
两 者 的 不 兼容 之 处 大 多 与 C++ 更 严格 的 类 型 检查 有 关 。 

下 面 是 一 个 合法 的 C 语言 程序 , 但 它 不 是 合法 的 C++ 程序 ,原因 在 于 其 中 一 个 标识 
(class) 是 C++ 的 关键 字 , 但 不 是 C 的 关键 字 : 


int class(int new, int bool); /* C, but not C++ */. 


下 面 是 一 个 在 两 种 语言 中 都 合法 , 但 语义 不 同 的 例子 : 
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int s = sizeof('a'); f* sizeof(int), often 4 in Cand 1 in C++ */ 

在 C 语言 中 , 字符 常量 (如 'a ') 的 类 型 是 int, 而 在 C++ 中 是 char。 但 是 , 对 于 一 个 char 型 变量 
ch ,两 种 语言 中 都 有 sizeof( ch) = 

关于 兼容 性 和 语言 差异 的 话题 总 是 不 那么 令 人 兴奋 ， 因为 里 面 没有 什么 新 的 程序 设计 技术 可 
学 。 你 可 能 会 对 printf( ) (参见 27.6 节 ) 感 兴趣 , 但 除 此 之 外 (以 及 一 些 无 用 的 工程 师 间 的 幽默 ) 
本 章 显 得 有 些 干巴 巴 的 。 本 章 的 目的 很 简单 : 使 你 能 读 写 C 程序 (如 果 你 有 这 种 需求 的 话 ) 。 本 
章 内 容 主 要 是 指出 一 些 潜在 的 危险 : 一 些 有 经 验 的 C 程序 员 认 为 很 显然 , 但 对 于 C++ 程序 员 通 常 
很 意外 的 东西 。 我 们 希望 你 能 以 最 小 Oe 人 中 撞 得 头 破 
血 流 。 

大 多 数 C++ 程序 员 迟早 都 会 中 到 必须 处 理 C 代码 的 情况 ， 就 像 大 多 数 C 程序 员 必须 处 理 
C++ 代码 一 样 。 本 章 介绍 的 很 多 内 容 对 于 大 部 分 C 程序 员 来 说 都 是 很 熟悉 的 内 容 , 但 也 有 一 些 
内 容 属 于 “专家 级 知识 ”。 原 因 很 简单 : 人 们 对 什么 是 “专家 级 ”很 难 达 成 共识 , 我 们 只 是 介绍 那些 
实际 程序 中 很 常见 的 问题 。 也 许 理解 兼容 性 问题 是 顾 得 ”C 专家 ”赞誉 的 捷径 , 但 请 记 住 ; 真正 的 
专家 水 平 是 指使 用 语言 (本 章 中 是 C) 的 水 平 高 超 , 而 不 是 指 理解 了 一 些 深奥 的 语言 规则 (如 一 些 
兼容 性 问题 ) 。 
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我 的 论文 在 我 的 主页 上 很 容易 找到 。 
27. 1.2 C 不 支持 的 C++ 特性 
从 C++ 的 角度 ，C( 即 C89 ) 缺少 很 多 特性 ， 例 如 
e 类 和 成 员 函 数 
s 解决 方法 : 使 用 stmct 和 全 局 函数 。 
派生 类 和 虚 函 数 
a 解决 方法 : 使 用 struct、 全 局 函数 和 中 数 指针 (参见 27.2.3 节 ) 
模板 和 内 联 函 数 
a 解决 方法 : 使 用 宏 ( 参 见 27.8 节 )。 
e 异常 
s 解决 方法 : 使 用 错误 代码 、 错 误 返 回 值 等 。 
清 数 重 载 
= 解决 方法 : 不 同 a 
new/ delete: 
s 解决 方法 : 使 用 malloc( )/free( ) 和 分 高 的 初 如 化 / 结束 处 理 代码 。 
。 引用 


016 第 四 部 分 后 帘 太 妓 


sa 解决 方法 : 使 用 指针 。 
常量 表达 式 中 的 const 
a 解决 方法 : 使 用 宏 。 
for 语句 中 的 声明 和 作为 语句 的 声明 
= 解决 方法 : 将 所 有 声明 都 放 在 语句 块 的 头 部 , 或 者 为 每 组 定义 引入 一 个 新 的 语句 块 。 
s bool 类 型 
= 解决 方法 : 使 用 int。 
static_cast 、reinterpret_cast 和 const_cast 
sa 解决 方法 : 使 用 C 人 C++ 风格 的 static < int > (a)。 
。 // 注 释 
= 解决 方法 : 使 用 / * .…. ， /注释 。 

很 多 有 用 的 代码 都 是 用 C 写 的 , 因此 上 面 这 个 列表 实际 上 在 提醒 我 们 : 没有 什么 语言 特性 是 
绝对 必要 的 。 很 多 语言 特性 , 甚至 是 大 多 数 C 语言 特性 ,只 是 为 了 方便 程序 员 编 写 程序 而 设计 
的 。 毕 竞 , 如果 你 足够 聪明 、 足 够 有 耐心 ,而 且 给 你 足够 时 间 的 话 , 任何 程序 都 可 以 用 汇编 语言 
写 出 来 。 注 意 , 由 于 C 和 C++ 都 使 用 相同 的 机 器 模型 ， 而 且 这 个 模型 非常 接近 实际 计算 机 ,因此 
它们 都 非常 适合 于 模拟 很 多 不 同 的 程序 设计 风格 。 

本 章 简 余 部 分 将 介绍 在 没有 这 些 特 性 的 情况 下 如 何 来 编写 有 用 的 程序 。 对 于 使 用 C 语言 , 我 
们 的 基本 建议 如 下 : 

。 用 C 语言 特性 来 模拟 C++ 特性 所 支持 的 程序 设计 技术 。 

。 当 编 写 C 程序 时 , 使 用 C++ 中 的 C 子 集 。 

。 调整 编译 器 的 警告 级 别 , 确保 进行 函数 参数 检查 。 

。 对 于 大 型 程序 , 使 用 lint( 参见 27.2.2 节 )。 

很 多 C/C++ 不 兼容 之 处 的 细节 相当 聊 涩 难 懂 。 但 是 ,如果 只 是 读 写 C 程序 , 大 多 数 细节 你 都 不 
必 记 忆 ， 因为: 

。 当 你 使 用 C 不 支持 的 C++ 特性 时 , 编译 器 会 提醒 你 。 

。 如 果 遵 循 上 述 原 则 ,你 几乎 不 会 遇 到 相同 语句 在 C 和 C++ 中 语义 不 同 的 情况 。 
虽然 缺少 上 述 C++ 特性 , 但 也 有 一 些 特性 在 C 中 更 为 重要 : 

。 数组 和 指针 

。 宏 

es typedef 


® sizeof 

。 类 型 转换 
本 章 中 也 会 给 出 这 些 特 性 的 一 些 例子 。 

我 将 C 的 前 身 BCPL 中 的 // 注 释 引 和 信 了 C++ ， 因 为 我 真 的 厌烦 了 输入 /* ... */ 方 式 的 注 
释 。 很 多 C 的 方言 包括 C99 都 支持 //, 因此 它 在 很 多 情况 下 是 安全 的 , 尽管 使 用 就 是 。 但 在 本 章 
中 , 对 于 C 语言 的 例子 程序 , 我 们 只 使 用 / * ... */ 注 释 。C99 吸纳 了 一 些 C++ 的 特性 (以 及 一 
些 和 C++ 兼容 的 特性 ), 但 在 本 章 中 我 们 使 用 C89, 因为 C89 要 普及 得 多 。 
27. 1.3 C 标准 库 

很 自然 , C++ 中 与 类 和 模板 相关 的 特性 C 是 不 支持 的 , 包括 : 
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gt 


Vector 

® map 

® Set 

® string 

。STL 算 法 : 如 sort() 、find( ) 和 copy() 

® lostream 

® regex 
对 于 这 些 特性 ， 我 们 通常 可 以 用 基于 数组 、 指针 和 函数 的 C 标准 库 特性 来 完成 类 似 功能 。 C 标准 
库 主 要 包括 如 下 部 分 : 

e < stdlib. h > ; 一 般 工 具 ( 如 malloc( ) 和 free( ) ,参见 27.4 节 )。 

e < stdio. h > : 标准 IO, 参见 27.6 节 。 

e。 < string. h > : C 风格 字符 串 处 理 和 内 存 管理 , 参见 27.5 节 。 

e。 < math. h > : 标准 浮 点 算术 国 数 ,参见 24. 8 节 。 

e < ermrno.h >: < math. h > 所 涉及 的 错误 码 , 参见 24.8 节 。 

e < jimits. h > ， 整数 类 型 的 大 小 , 参见 24.2 节 。 

e <tme.h> : 日 期 和 时 间 , 参见 26.6.1 节 。 

e < assert. h > : 调试 用 的 断言 ,参见 27.9 节 。 

e < ctype. h > : 字符 集 , 参见 11.6 节 。 

e < stdbool.h > , 布尔 宏 。 
这 些 标准 库 特 性 的 完整 说 明 , 请 查阅 好 的 C 语言 教材 , 如 K&R。 所 有 这 些 库 (和 头 文件 ) 也 存在 于 
C++ 中 。 


27.2 项 数 


在 C 中 : 

e 孔 数 不 能 重 名 。 

e 畏 数 参 数 类 型 检查 是 可 选 的 , 不 是 强制 的 。 

。 没有 引用 类 型 (因而 参数 传递 也 没有 传 引用 方式 ) 。 

e 没有 成 员 函 数 。 

e 没有 内 联盟 数 (C99 除外 )。 

e 有 可 选 的 函数 定义 语法 。 
除 此 之 外 ，cC 的 函数 与 C++ 很 相似 。 我 们 来 逐个 考察 这 些 差别 。 
27. 2. 1 不 支持 函数 名 重 载 

考虑 下 面 代码 : 


void print(int); /* print an int */ 
void print(const char*); /* printa string */ /* error!l */ 


第 二 个 声明 是 错误 的 ,因为 两 个 函数 不 能 同名 。 所 以 你 必须 设计 两 个 恰当 的 名 字 : 
void print_int(inft); f* print an int */ 
void print_string(const char*); /* print a string */ 


不 支持 函数 重 载 有 时 还 会 被 认为 是 一 个 好 的 特性 : 不 会 发 生 使 用 错误 的 函数 输出 整数 的 意外 情况 
了 ! 显然 , 我 们 并 不 接受 这 种 说 法 , 不 支持 函数 重 载 使 得 泛 型 程序 设计 思想 变 得 很 获 众 ,因为 泛 
型 程序 设计 的 重要 特点 就 是 用 相同 的 名 字 表 示 语 义 相 似 的 函数 。 
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27.2.2 项 数 参数 类 型 检查 
考虑 下 面 代码 : 


int main!() 
{ 
f(2); 


它 在 C 编译 器 中 会 顺利 编译 通过 , 也 就 是 说 , 你 不 必 在 使 用 函数 之 前 声明 函数 (虽然 你 可 以 这 人 么 
做 , 而 且 也 应 该 这 么 做 )。f( ) 可 能 定义 在 程序 某 个 地 方 , 也 可 能 在 其 他 文件 中 ， A 
的 话 ,连接 程序 就 会 报错 。 

木 幸 的 是 , 即使 f( ) 定 义 在 其 他 文件 中 , 它 也 有 可 能 是 这 样 的 : 

/* other_file.c: */ 


int f(char* p) 
{ 


intr = 0; 
While (*p++) P++; 
return r; 
} 
连接 程序 不 会 报告 这 个 错误 。 你 只 全 得 到 _ 个 运行 时 错误 或 者 是 奇怪 的 运行 结果 。 
我 们 如 何 应 对 这 类 问题 呢 ? 头 文 件 的 一 致使 用 是 一 个 实用 的 方法 。 如 果 你 调用 或 定义 的 每 
个 函数 都 在 一 个 特定 的 头 文件 中 声明 ,而 且 无 论 是 否 用 到 ,每 个 程序 文件 都 包含 此 头 文件 , 那么 
我 们 就 可 以 确保 函数 声明 检查 。 然 而 ,在 大 型 程序 中 , 这 很 难 做 到 。 因 此 , 大 多 数 C 编译 器 都 具 
备 对 应 的 编译 选项 , 来 选择 是 否 对 未 定义 函数 的 调用 给 出 警告 , 我 们 可 以 利用 这 一 特性 。 而 且 ， 
从 C 语 言 出 现 的 早期 开始 , 就 已 经 有 了 能 检查 代码 一 致 性 问题 的 程序 。 这 些 程序 通常 称 为 lint。 
在 编译 每 个 大 型 程序 之 前 , 我 们 都 应 该 使 用 lint 来 检查 程序 。 你 会 发 现 lint 会 推动 你 以 非常 类 似 
C++ 子 集 的 方式 来 使 用 C。 因 为 C++ 最初 的 一 个 设计 目标 就 是 使 编译 器 能 容易 地 检查 更 多 ( 而 不 
是 所 有 )lint 能 检查 的 问题 。 
你 可 以 让 C 进行 函数 参数 检查 。 这 很 简单 , 只 要 在 函数 声明 时 指出 参数 类 型 即 可 (如 同 C++ 
那样 ) 。 这 种 函数 声明 称 为 函数 原型 (fanction prototype)。 但 是 , 要 小 心 那些 未 指定 参数 的 函数 声 
明 , 那些 声明 不 是 函数 原型 ， 并 不 保证 进行 画 数 参数 检查 


int g(doubie); /* prototype 一 like C++ function declaration */ 
int h(); /* not a prototype 一 the argument types are unspecified % 


vold my_fct() 
{ 


0); Am error: missing argument */ 


S(rasdf"); /* error: bad argument type */ 

g(2); /* OK: 2 is converted to 2.0 */ 

8(2,3); /* error: one argument too many */ 

h0; /* OK by the compiler! May give unexpected results */ 
h(*asdf");  /* OK by the compiler! May give unexpected results */ 
h(2); /* OK by the compiler! May give unexpected results */ 
h(2,3); /* OK by the compiler May give nexpecteg results */ 


} 
其 中 , hl ) 的 声明 没有 指定 参数 类 型 。 这 并 不 意味 着 h( ) 不 接受 参数 ， 而 是 意味 着 接受 任何 参数 
集合 ,期 望 它 们 与 被 调 函 数 匹配 。 hon nn ， 而 lint 可 以 检 
查 出 这 类 问题 。 


C++ C 等 价 语法 

void f( ) ; A 首选 方式 void f( void) ; 

void f( void ) ; void f( void) 

void f(... ) ; /7 接受 任何 参数 void f{( ) ; /* 接受 任何 参数 */ 


对 于 作用 域 中 找 不 到 函数 原型 的 情况 , C 定义 了 一 组 特殊 的 规则 来 转换 参数 。 例 如 ，char 和 short 
会 转换 为 int, 而 float 会 转换 为 double。 如 果 需 要 了 解 相 关内 容 ， 比 如 说 long 如 何 处 理 , 请 查阅 好 
的 C 教材 。 我 们 的 建议 很 简单 : 所 有 函数 都 应 该 给 出 函数 原型 。 

注意 ,即使 错误 类 型 的 参数 通过 了 编译 器 的 检查 ,例如 将 一 个 char * 传递 给 了 int 型 的 参数 ， 


在 其 使 用 中 也 会 出 错 。 如 Dennis Ritchie 所 说 ;“C 是 一 个 强 类 型 、 弱 检查 的 程序 设计 语言 。 
27. 2.3 函数 定义 
你 可 以 像 在 C++ 中 一 样 定义 函数 , 定义 本 身 就 是 函数 原型 : 
double square(double d) 
return d*d; 
} 
void ff() 
{ 
double x = square(2); rn” OK: convert 2 to 2.0and call */ 
double y = square(); /* argument missing */ 
double y = square("Hello"); /* error: wrong argument type */ 
double y = square(2,3); /* error: too many arguments */ 
} 。 
没有 参数 的 函数 定义 不 是 函数 原型 ， 
void f() {/* do something */} 
void g() 


{ 
1(2); /OK in C:; error in C++ */ . 


其 中 

void f(); /* no argument type specified */ 
童 为“f( ) 可 以 接受 任意 数目 、 任意 类 型 的 参数 ”", 这 看 起 来 真 的 很 奇怪 。 为 此 , 我 发 明了 一 种 新 的 
语法 , 用 关键 字 void 显 式 表 示 “ 什 么 都 没有 ”的 含义 (英文 单词 void 的 意 思 就 是 什么 都 没有 ); 

void f(void); /* no arguments accepted */ 
我 很 快 就 后 悔 了 ,因为 这 种 方式 看 起 来 很 奇怪 , 而 且 如 果 能 够 保证 进行 参数 类 型 检查 的 话 , 这 种 
方式 完全 是 多 余 的 。 更 糟 的 是 ，Dennis Ritchie( C 语言 之 父 ) 和 Doug Mcllroy( 在 贝尔 实验 室 计算 机 
科学 研究 中 心 内 部 , 他 是 审美 方面 的 最 终 裁决 者 ) 都 称 void 参数 是 “讨厌 的 "”。 不 幸 的 是 , 这 个 讨 
厌 的 东西 在 C 社 群 内 已 经 非常 流行 了 。 在 C++ 中 不 要 使 用 它 ,因为 在 C++ 中 , 它 不 仅 丑 陋 , 而 
且 逻 辑 上 是 多 余 的 。 

C 还 提供 另 一 种 Algol60 风格 的 函数 定义 方式 一 一 参数 类 型 (可 选 的 ) 与 参数 名 分 离 

int old_style(p,b,x) char* p; char b; 

{ 

er | 

} , 
这 种 ”旧式 定义 " 比 C++ 的 历史 还 早 ， 它 也 不 是 函数 原型 。 默 认 情 况 下 , 未 指定 类 型 的 参数 被 当 
做 int 型。 因此 , x 是 函数 old_style( ) 的 一 个 整 型 参数 。 我 们 可 以 这 样 调用 old_style( ) : 
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old_style(); /* OK: all arguments missing */ 
old_style("hello", ‘a’, 17); /* OK: ail arguments are of the right type */ 
old_style(12, 13, 14); /* OK: 12 is the wrong type, “/ 


/* but maybe old_style() won't use p */ 
编译 器 应 该 会 接受 这 些 调用 (但 我 们 期 望 它 对 第 一 个 和 第 三 个 调用 能 给 出 警告 ) 。 
ae, 我 们 的 建议 是 : 
。 坚持 使 用 肾 数 原型 (使 用 头 文件 )。 
。 设置 编译 器 的 警告 级 别 , 使 它 能 捕获 参数 类 型 错误 。 
s 使 用 lint。 
遵循 这 些 原则 的 结果 就 是 ， 写 出 的 C 代码 也 是 正确 的 C++ 代码 。 
27.2.4 C++ 调 用 C 和 C 调 用 C++ 


如 果 编 译 器 支持 的 话 , 你 可 以 将 C 编译 器 编译 出 的 目标 文件 和 C++ 编译 出 的 目标 文件 连接 
在 一 起 。 例 如 , 你 可 以 将 GNU C/C++ 编译 器 (GCC) 编 译 出 C 和 C++ 目标 文件 连接 在 一 起 。 微 软 
C/C++ 编译 器 (MSC++ ) 生 成 的 C 和 C++ 目标 文件 也 可 以 连接 在 一 起 。 这 种 开发 方式 很 常见 也 
很 有 用 , 你 可 以 使 用 的 库 的 范围 大 大 拓宽 , 不 必 受 限于 一 种 语言 的 库 。 

C++ 的 类 型 检查 比 C 严格 。 特 别 是 ,， C++ 的 编译 器 和 连接 器 会 检查 两 个 歇 数 f(int ) 和 
f( double) 的 定义 和 使 用 是 否 一 致 , 即使 定义 和 使 用 在 不 同 的 源 文件 中 。 而 C 连接 器 不 会 做 这 种 检 
查 。 为 了 从 C++ 中 调用 C 哨 数 ,以 及 从 C 中 调用 C++ 函数 ,应 该 通知 编译 器 我 们 的 意图 : 


/ calling C function from C++: 

extern "C” double sqrt(double); /link as a C function 
void my_c_plus_plius_fct0 

{ 


double sr = sqrt(2); 
} 


extem“C” 告 知 编译 器 使 用 C 连接 器 约定 。 除 此 之 外 , 与 普通 C++ 函数 没有 什么 区 别 。 实 际 上 ， 
C++ 标准 库 函 数 sqrt( double) 通 常 就 是 C 标准 库 中 的 sqrt( double)。 采 用 这 种 方法 , 无 需 对 C 程序 
进行 任何 特殊 处 理 , 其 中 的 函数 就 能 被 C++ 程序 调用 。 我 们 要 做 的 全 部 事情 只 是 让 C++ 采用 C 
的 连接 约定 。 

extem“C” 也 可 用 来 使 C++ 纯 数 能 被 C 调用 : 


I/ C++ function callable from C: 


extern "C" int call_f(S* py int i) 
{ 

return p—>f()); 
} 


这 样 , 我 们 就 可 以 在 C 程序 中 间接 调用 成 员 函 数 代 ) 了: 


rr call C++ function from C: ¥/ 


int call_f(S* p, int i); 
struct S* make_S(int,const char*); 


void my_c._fct(int i) 
{ 
Pie 
struct S* p= make_S(x, "foo"); 
int x = call_f(p,); 
Mss 
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在 C 中 无 需 ( 或 不 可 能 ) 声 明 这 是 一 个 C++ 图 数 。 

这 种 互 操作 性 的 好 处 是 显而易见 的 ; 可 以 混合 使 用 C 和 C++ 编写 程序 。 特 别 是 ，C++ 程序 
可 以 使 用 C 库 , 而 C 程序 也 可 以 使 用 C++ 库 。 

在 上 例 中 ， 我 们 假定 C 和 C++ 可 以 共享 p 指向 的 类 对 象 。 对 于 大 多 数 类 对 象 来 说 , 这 是 没有 


问题 的 。 特 别 是 , 如 果 你 定义 了 下 面 这 样 的 类 ， 
lin C++: 
class complex { 
double re, im; 
public: 
// all the usual operations 
}; 
你 可 以 在 C++ 程序 和 C 程序 之 间 传递 对 象 指针 , 甚至 可 以 在 C 程序 中 访问 re 和 im, 只 需 定义 如 
下 结构 类 型 : 
PinC:™/ 
struct complex { 
double re, im; 
/* no operations */ 


); 
任何 程序 设计 语言 中 的 内 存 布 局 规则 都 可 能 很 复杂 , 不 同 语言 混合 编程 中 的 内 存 布局 规则 就 更 加 
难以 说 清 。 但 对 于 C 和 C++ 来 说 , 内 置 类 型 和 没有 虚 函 数 的 类 (stmuet) 对 象 可 以 直接 传递 。 如 果 
类 具有 虚 函 数 , 你 只 能 传递 对 象 的 指针 ,而 且 实际 的 处 理工 作 应 该 交 给 C++ 代码 。call_f( ) 就 是 
一 个 例子 : f( ) 可 能 是 虚 函 数 ， 这 个 例子 展示 了 如 何在 C 程序 中 调用 虚 函 数 。 

除了 内 置 类 型 外 , 最 简单 也 最 安全 的 类 型 共享 方式 就 是 在 一 个 公共 头 文件 中 定义 stuct。 但 
是 , 这 种 方法 严重 限制 了 C++ 的 编程 模式 , 因此 我 们 不 会 局 限于 这 种 方式 。 
27. 2.5 函数 指针 

如 果 希 望 在 C 中 使 用 面向 对 象 技术 (参见 14.2 ~ 14. 4 节 ), 应 该 怎么 做 呢 ? 最 重要 的 是 要 找到 
虚 函 数 的 替代 技术 。 大 多 数 人 会 马上 想到 一 个 主意 : 在 struct 中 添加 一 个 “类 型 域 " 来 指明 对 象 是 基 
类 还 是 某 个 派生 类 , 例如 ,对 于 shape 及 其 派生 类 , 指明 给 定 对 象 是 哪 种 形状 。 如 下 面 程序 所 示 : 


struct Shape1{ 
enum Kind { circle, rectangle } kind; 
se 

}; 


void draw(struct Shapel1* p) 
{ 


switch (p—>kind) { 

Case circle: 
/draw as circle */ 
break; 

Case rectangle: 
f/* draw as rectangle */ 
break; 


} 


int f(struct Shapel * pp) 
{ 
draw(pp); 
人 
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这 段 程序 可 以 正常 工作 , 但 存在 两 处 隐患 : 
”ee 我 们 必须 为 每 个 “ 伪 虚 函数 "( 如 draw( ),) 编写 一 个 新 的 switch 语句 。 
e。 每 当 加 入 一 个 新 的 形状 ， en (如 draw( ) ) ,为 switch 语句 增 
加 一 个 case 分 文 。 
第 二 个 问题 非常 讨厌 ， 它 意 味 着 我 们 不 可 能 将 “ 伪 虚 函数 ” 放 在 库 中 ， 因为 用 户 不 得 不 频 质 繁 修改 这 


些 哨 数 。 虚 蚂 数 最 有 效 的 蔡 代 技术 之 一 是 函数 指针 : 
typedef void (*Pfct0)(struct Shape2*); 
typedef void (*Pfct1int)(struct Shape2* ,int); 


struct Shape2 1{ 
Pfct0 draw; 
Pfctlint rotate; 
fs sa 
}; 
void draw(struct Shape2"* p) 
{ 
(p->draw)(p); 


void rotate(struct Shape2* p, int d) 
{ 

(p~->rotate)(p,d); 
) 


Shape2 的 使 用 与 Shapel 一 样 : 


int f(struct Shape2* pp) 

{ | 
draw(pp); 
Pi 


} 
稍微 做 一 点 改动 , 对 象 就 不 必 携 带 每 个 伪 虚 薄 数 的 指针 ， 而 是 保存 一 个 指向 函数 指针 数组 ( 对 于 
C++ 中 虚 函 数 的 所 有 实现 ) 的 指针 即 可 。 在 实际 程序 设计 中 ， 这 种 方法 的 主要 问题 是 要 正确 初始 
化 所 有 函数 指针 。 


27. 3 小 的 语言 差异 

本 节 介 绍 C 和 C++ 之 间 的 一 些小 的 差异 ， 如 果 你 从 未 听 说 过 这 些 差异 的 话 ， 就 容易 犯错 。 一 
些 差异 还 会 严重 影响 与 之 明显 相关 的 程序 设计 工作 。 
27. 3. 1 ”结构 标签 名 字 空 间 

在 C 中 , struct 的 名 字 (C 中 没有 类 ) 与 其 他 标识 符 位 于 不 同 的 名 字 空 间 。 因 此 , 每 个 struct 的 
名 字 ( 称 为 结构 标签 ，structure tag) 必须 以 关键 字 struct 为 前 组 。 例 如 : 


struct pair { int x,y; }; 

pair p1; /* error: no identifier “pair” in scope */ 

struct pair p2; OK*/ 

int pair = 7; /* OK: the struct tag pair is not in scope */ 

struct pair p3; /* OK: the struct tag pair is not hidden by the int */ 
pair = 8; f/* OK: “pair” refers to the int */ 


令 人 惊讶 的 是 , 归功 于 一 个 不 很 正当 的 兼容 性 漏洞 , 这 段 代码 在 C++ 中 也 是 正确 的 。 变 量 (或 者 
函数 ) 与 struct 同名 是 一 种 常见 的 C 语言 用 法 , 但 我 们 并 不 推荐 这 样 做 。 

如 果 你 不 希望 在 每 个 结构 名 之 前 写 上 struct 前 级 , 可 以 使 用 typedef( 参 见 20.5 节 ) 。 下 面 的 程 
序 写法 很 常见 : 
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typedef struct (int x,y; } pair; 
pair pt = {1,2); z 
一 般 而 言 , typedef 在 C 中 更 为 常见 , 也 更 为 用, 因为 在 C A 
类 型 。 
在 C 中, 藤 套 的 struct 的 名 字 与 包含 它 的 struct 位 于 同一 个 作用 域 中 , 例如 ; 


struct S{ 
structT{/*...*/}; 
1 

}; 


structTx; /*OKinC {notin Cr+)* 


而 在 C++ 中 , 你 必须 这 样 写 : 


S::Tx; /OK in C++ (not in C) 
只 要 可 能 , 不 要 使 用 典 入 的 struct: 其 作用 域 规则 与 大 多 数 人 的 自然 的 (也 是 合理 的 ) 想 法 不 同 。 
27. 3.2 关键 字 

很 多 C++ 关键 字 不 是 (C 关键 字 ( 因为 C 不 支持 对 应 ND), 因此 可 以 用 作 C 标识 符 ; 


C++ 关键 字 而 不 是 C 关键 字 

and and eq asm bitand bitor bool 
catch class compi! const_cast deiete dynamic_cast 
explicit export false friend iniine mutable 
namespace new not not_eqg operator or 

or_eq private protected public reinterpret cast static_cast 
template this throw true try typeid 
typename using virtual wchar_t XOr xor_eq 


不 要 将 这 些 名 字 用 作 C 标识 符 , 否则 你 的 程序 将 无 法 移植 为 C++ 程序 。 如 果 你 在 头 文件 中 使 用 
了 这 些 名 字 , 头 文件 将 无 法 被 C++ 使 用 。 


一 些 C++ 关键 字 是 C 中 的 宏 : 
C++ 关键 字 ，C 中 的 宏 
and andeq bitand bitor bool compl false 
not not_eq or or_eq true wchar._t xor xor_eq 


在 C 中 , 这 些 宏 是 在 < iso646. h > 和 < stdbool. h > (bool、true、false) 中 定义 的 。 不 要 利用 它们 是 C 
的 宏 这 一 特性 。 
27. 3.3 定义 

与 C 相 比 , C++ 允许 将 定义 放置 在 程序 更 多 的 地 方 。 例 如 : 


for (int i = 0; ji<max; ++i) x[i] = ylil; /definition of i not allowed in C 


while (struct S* p = next(q)) { // definition of p not allowed in C 
审 素 
fe 
void flint i) 
: if (i< 0 | max<=i) error("range error"); 
int a[max]; /error': declaration after statement not allowed in C 


as 
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C( C89 ) 不 允许 在 for 语句 的 初始 化 部 分 、 条 件 判 断 或 者 语句 块 中 语句 之 后 放置 声明 。 这 段 代码 在 
C 中 必须 这 样 写 : 

int i; 

for (i = 0; icmax; ++i) x[i] = y[i]; 

struct S$” p; 

while (p = next(q)) { 

人 
} 
void ffint i) 


if (i< 0 | max<=i) error("range error"™); 
{ 
int a[max]; 
ee 
} 
} 。 
在 C++ 中 , 未 初始 化 的 声明 被 视 为 一 个 定义 , 但 在 C 中 , 仍 被 视 为 一 个 声明 , 因此 可 以 重复 多 次 : 
int x; 
ji x; /* defines or declares a single integer called x in C; error in C++ "*/ 
在 C++ 中 , 每 个 实体 只 能 定义 一 次 。 这 引出 一 个 有 趣 的 问题 : 如 果 不 同 源 文件 中 有 两 个 同样 的 定 
义 , 会 发 生 什 么 情况 ? 
f° in file x.c: */ 
int x; 


Fh in file y.c: */ 

int x; 
单独 编译 x.c 或 yc 的话, C 和 C++ 编译 器 都 不 会 发 现 错误 。 但 是 ,如 果 在 C++ 中 将 xe 和 y。 
一 起 编译 ,连接 程序 会 报告 “重复 定义 "错误 。 如 果 两 者 是 在 C 中 一 起 编译 ,连接 会 顺利 通过 , 因 
为 (根据 C 的 规则 ) 连接 程序 认为 xc 和 了 c 共享 一 个 x。 但 最 好 不 要 用 这 种 方式 , 如 果 你 确实 希 
望 不 同 源 文件 共享 一 个 全 局 变量 x, 应 该 显 式 地 声明 : 


f* in file x.c: */ 
int x = 0; /* the definition */ 


Ff in file yc: */ 
externintx; /a declaration, nota definition */ 


更 好 的 方式 是 使 用 头 文件 : 


Ain file x.h: */ 
extern int x; /* a declaration, not a definition */ 


Fr in file x.C: */ 

相 nclude "x.h" 

int x = 0; f* the -definition */ 

fF in file y.c: */ 

#include "x.h" 

f/* the declaration of x is in the header */ 


当然 , 最 好 的 方式 是 避免 使 用 全 局 变量 。 
27. 3.4 C 风格 类 型 转换 
在 C 中 (C++ 中 也 可 以 ), 你 可 以 用 下 面 这 样 的 简单 语法 来 实现 值 v 向 类 型 T 的 转换 : 
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(Tv 
这 种 “C 风格 类 型 转换 "或 称 为 “老式 类 型 转换 ”, 受到 打字 不 熟练 或 者 马虎 的 程序 员 的 欢迎 . 因为 
它 非常 简单 ,而且 你 不 必 了 解 v 到 底 是 如 何 转换 为 类 型 T 的 。 但 代码 维护 大 员 却 很 害怕 这 种 形 
式 ， 因 为 它 几 乎 是 隐形 的 ,而 且 对 于 程序 作者 的 意图 没有 给 出 任何 线索 。C++ 风格 的 类 型 转换 
(或 称 为 新 式 类 型 转换 或 模板 方式 转换 参见 附录 A. 5.7) 是 显 式 的 类 型 转换 ,因此 易于 发 现 、 意义 
明确 。 但 在 C 中 , 我 们 只 能 使 用 老式 的 类 型 转换 


int"p=(int*)7:  /* reinterpret bit pattern: reinterpret_cast<int*>(7) */ 
int x = (int}7.5; Ftruncate double: static_cast<int>(7.5) */ 


typedef struct ST1{/*...*/}S1; 

typedef struct S2{/*...*/} $2; 

$2 a; 

const $2 b; fr uninitialized consts are allowed in C */ 


si*p=(Si)&a; /reinterpret bit pattern: reinterpret_cast<S1*>(&a} */ 
$2° q= (52°)&b; /* cast away const: const_cast<S2*>(&b) */ 
Sir=(S1°)&b; /remove constand change type; probably a bug */ 


即使 在 C 语言 中 , 我 们 也 很 犹 移 是否 推 荐 使 用 宏 ( 参 见 27.8 节 ), 但 宏 又 确实 可 以 表达 某 些 
思想 ， 


#define REINTERPRET_CAST(T,v) ((T}(v)) 
#define CONST_CAST(T,v) ((T)(v)) 


S1* p = REINTERPRET_CAST (S1*,&a); 
$2°* q = CONST_ CAST(S2*,&b); 


这 种 方法 并 不 具备 interpret_cast 和 const_cast 的 类 型 检查 能 力 , 而 且 很 丑陋 , 但 它 至 少 易于 发 现 ， 
也 使 程序 员 的 意图 更 为 明显 。 
27. 3.5 void "的 转换 


在 C 中 , 我 们 可 以 将 void ”赋予 任何 指针 类 型 的 变量 ,或 用 它 来 初始 化 指针 变量 , 在 C++ 中 
这 是 不 可 以 的 。 例 如 : 


void* alloc(size_t x); /* allocate x bytes */ 


void f (int n) 
{ 
int* p = alloc(n*sizeof(int)); f* OK in C; error in C++ */ 
Fa 
} 
在 这 段 代码 中 , alloc( ) 返 回 的 void" 值 被 隐 式 地 转换 为 int* 类 型 。 而 在 C++ 中 , 我 们 必须 这 样 写 : 
int* p = (int*)alloc(n*sizeof(int)); OK in Cand C++ */ 


这 条 语句 使 用 了 C 风格 的 类 型 转换 (参见 27. 3.4 节 ), 因此 在 C 和 C++ 中 都 是 正确 的 。 


为 什么 在 C++ 中 void 到 T 的 隐 式 类 型 转换 是 非法 的 呢 ? 因为 这 种 转换 可 能 是 不 安全 的 ， 
void f() 
{ 
char i = 0; 
char j = 0; 
char* p = &i; 
void* q=p; 
int* pp = q; /* unsafe; legal in C, error in C++ */ 
*pp=-1; /* overwrite memory starting at &i */ 
} 


在 这 段 代 码 中 , 我 们 甚至 不 能 确定 哪个 内 存 区 域 被 更 改 了 。 也 许 是 j 和 Pp 的 一 部 分 ? 也 许 是 用 于 f( ) 
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的 调用 管理 的 内 存 区 域 (f 的 调用 栈 )? 无 论 怎样 , 对 f( ) 的 调用 都 是 一 件 糟糕 的 事情 。 

注意 , 从 T 到 void ”的 ( 反 向 ) 转 换 是 百分之百 安全 的 , 这 样 的 转换 不 会 形成 像 上 面 代 码 一 样 
糟糕 的 程序 , 因此 在 C 和 C++ 中 都 允许 这 样 的 转换 。 

不 幸 的 是 , 隐 式 的 void* 到 T* 的 类 型 转换 在 C 程序 中 随处 可 见 , 这 也 许 是 实际 程序 中 最 主要 
的 C/C++ 兼容 性 问题 。 
27. 3.6 枚 举 

在 C 中 , 我 们 可 以 将 一 个 int 值 赋予 一 个 enum 变量 , 而 无 需 类 型 转换 。 例 如 : 


enum color { red, blue, green }; 
int x = green; "OKinCandC++*/ 
enum color col=7; /* OK in C; errorin C++*/ 


这 个 特性 意味 着 , 在 C 中 我 们 可 以 对 枚 举 变量 进行 增 1( ++ ) 和 减 1(-- ) 运 算 。 这 可 能 很 方便 ， 
但 会 导致 灾难 性 的 后 果 : 


enum color x = blue; 
++xX; /*xbecomes green; error in C++*/ 
++xX; /*xbecomes 3; error in C++ */ 


这 段 代 码 中 , x“ 跌 出 ”了 枚 举 常量 的 范围 , 可 能 我 们 就 是 想 这 么 做 , 但 也 很 有 可 能 是 我 们 无 意 中 犯 
的 错误 。 

注意 , 与 结构 标签 类 似 , 枚 举 类 型 名 也 位 于 自己 独立 的 名 字 空 间 中 , 因此 使 用 时 必须 使 用 关 
键 字 enum 作为 前 级 : 


color c2 = blue; /* error in C: color not in scope; OK in C++ “/ 
enum color c3=red; /*OK*/ 


27. 3.7 名 字 空 间 


C 不 支持 名 字 空 间 ( 这 里 的 “名 字 空间 ”一 词 是 指 在 C++ 中 的 含义 ) 。 那 么 在 大 型 C 程序 中 应 
该 如 何 避 免 名 字 冲 突 呢 ? 一 般 的 策略 是 使 用 前 级 和 后 级 。 例 如 : 


f* in bs.h: */ 
typedef struct bs_string {/* ...*/}bs_string; /* Bjarne’s string */ 
typedef int bs_bool ; /* Bjarne’s Boolean type */ 


Ain pete.h: */ 
typedef char* pete_string; /* Pete’s string */ 
typedef char pete_booi ; /* Petes Boolean type */ 


这 种 方法 实在 是 太 流行 了 , 因此 使 用 一 两 个 字母 的 前 缀 不 是 好 的 选择 , 很 容易 与 其 他 人 代码 中 的 
名 字 产 生 冲突 。 


27.4 动态 内 存 分 配 


C 并 未 提供 new 和 delete 操作 符 来 进行 对 象 分 配 与 释放 。 为 了 实现 动态 内 存 分 配 , 你 可 以 使 
用 一 些 函 数 来 直接 分 配 和 释放 内 存 空间 。 最 重要 的 几 个 函数 定义 在 "一般 工 具 "标准 头 文件 


< stdlib. h> 中 : 
‘void*: malloc(size_t sz); /* allocate sz bytes */ 
void free(void* p); /* deallocate the memory pointed to by p “/ 


void* calloc(size_ tn, size_t sz); /* allocate n*sz bytes initialized to 0 */ 
void* realloc(void* p, size _t sz); /* reallocate the memory pointed to by p 
to a space of size sz */ 


typedef size_t 也 是 在 < stdlib. h > 中 定义 的 , 它 是 用 typedef 定义 的 无 符号 整 型 。 
为 什么 malloc( ) 返回 一 个 void* ? 原因 在 于 它 不 知道 你 要 在 分 配 到 的 内 存 空间 中 存 和 人 什么 样 
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的 对 象 。 对 象 的 初始 化 应 该 是 你 的 责任 , 例如 : 
struct Pair { 
const char* p; 
int val; 
}; 
struct Pair p2 = {"apple",78}; 
struct Pair* pp = (struct Pair*) malloc(sizeof(Pair)); /* allocate */ 
pp->Pp = "pear™; fr* initialize */ 
pp->Yal = 42; 


注意 , 无 论 是 在 C 中 , 还 是 在 C++ 中 , 都 不 可 以 这 样 写 : 
*pp={"pear", 42};  /* error: not C or C++98 "*/ 
但 在 C++ 中 , 你 可 以 为 Pair 定义 一 个 构造 函数 , 然后 这 样 写 : 
Pair* pp = new Pair("pear", 42); 
在 C 中 (C++ 中 不 可 以 , 参见 27.3.4 节 ) , 可 以 省 略 malloe( ) 之 前 的 类 型 转换 ,但 我 们 不 推荐 这 么 做 : 
int* p = malloc(sizeof(int)*n);  /* avoid this */ 
省 去 类 型 转换 的 做 法 很 流行 , 因为 可 以 省 去 一 些 打字 工作 量 , 而 且 这 样 做 还 能 检查 到 一 种 罕见 的 错 
误 : 在 使 用 malloc( ) 之 前 忘记 了 包含 < stdlib. h > 。 但 是 , 这 种 方法 也 会 掩盖 内 存 大 小 的 计算 错误 : 
p= malloc(sizeof(char)*m); /* probably a bug 一 not room for m ints */ 
不 要 在 C++ 程序 中 使 用 malloc( )/free( ) , 因为 new/delete 不 需要 类 型 转换 , 可 以 进行 初始 化 (构造 
晴 数 ) 和 清理 工作 ( 析 构 函数 ), 还 能 报告 内 存 分 配 错误 ( 抛 出 异常 ), 而且 和 malloc( )/free( ) 一样 快 。 
例如 : 


int* p = new int[200]; 
free(p);  //error 


X* q = (X*)malloc(n*sizeof(X)); 
7 
delete q; / error 


这 有 段 代码 也 许 会 正确 运行 , 但 它 难以 移植 。 而 且 , 对 于 具有 构造 函数 和 析 构 函数 的 对 象 ， 如 果 混 
合 使 用 C 风格 和 C++ 风格 的 动态 内 存 分 配 代码 , 很 容易 导致 灾难 性 后 果 。 
级 数 realloc( ) 通常 用 于 扩展 缓冲 区 : 


int max = 1000; 
int count = 0; 
int c; 


char* p = (char*)malloc(max); 
while ((c=getchar())!=EOF) { f* read: ignore chars on eof line */ 


if (count==max—1) { As need to expand buffer */ 
max += max; /* double the buffer size */ 
p= (char*)realloc(p,max); 
if (p==0) quit(); 

} 


plcount++] = ¢; 


} 
C 的 输入 操作 的 相关 内 容 , 可 参见 27. 6.2 节 和 附录 B. 10. 2。 

函数 realloc( ) 可 以 将 数据 从 旧 的 内 存 空间 移动 到 新 的 内 存 空间 , 但 这 种 数据 移动 也 有 可 能 无 
法 完成 。 绝 对 不 要 将 realloc( ) 用 于 new 分 配 的 内 存 空间 。 

在 C++ 中 ,( 大 致 ) 等 价 的 代码 如 下 所 示 ( 使 用 了 标准 库 ) : 
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vector<char> buf; 
char ec; 
while (cin.get(©) buf.push_back(c); 


请 参考 《Leaming Standard C++ as a New Language》 一 文 (参见 27. 1 节 中 给 出 的 参考 文献 列表 ) , 其 
中 对 输入 和 内 容 分 配 策 略 进行 了 全 面 的 讨论 。 z 


27.5 C 风格 字符 串 


在 C 中 ,字符 串 (在 C++ 的 文献 中 , 通常 称 为 C 字符 串 或 C 风格 字符 串 ) 就 是 一 个 以 0( 数 
值 ) 结 尾 的 字符 数组 。 例如 : 


char* p = "asdf"; 
char S[] = 'asdf"; 





s: [area rlo. 
在 C 中 , 没有 成 员 函 数 机 制 , 不 能 重 载 函 数 ， 也 不 能 为 struct 定义 运算 符 (如 == ) 。 因 此 我 们 
需要 一 组 函数 ( 非 成 员 函 数 ) 来 处 理 字符 串 。C 和 C++ 的 标准 库 提供 了 如 下 函数 (在 < string. h > 
中 ) : 





size_t strien(const char* s); /* count the characters */ 
char* strcat(char* s1, const char* s2); f* copy $2 onto the end of s1 */ 
int strcmp(const char* s1, const char* s2); /* compare lexicographically */ 
char* strcpy(char* si1,const char* s2); /copy 5s2 into s1 */ 

char* strchr(const char *s, int c); /*findc ins*/ 


char* strstr(const char *s1, const char *s2); fr find s2 in ss1 */ 


char* strncpy(char*, const char*, size_t n); /se strcpy, max n chars */ 
char* strncat(char*, const char, size_t n); /* strcat with max n chars */ 
int strncmp(const char*, const char*, size tn); /* stremp with max n chars */ 


这 里 并 没有 列 出 所 有 字符 串 函数 , 但 最 有 用 和 最 常用 的 函数 都 已 经 列 出 了 。 我 们 人 简单 说 明 一 下 如 
何 使 用 这 些 函 数 。 

C 支持 字符 串 比 较 。 但 相等 运算 符 ( == ) 比较 的 是 两 个 字符 串 的 指针 值 , 标准 库 函数 stremp( ) 
才 是 比较 字符 串 内 容 的 : 


const char* s1 = "asdf"; 
const char* s2 = "asdf"; 


if (s1==s2) { /do s1 and s2 point to the same array? */ 
/* {typically not what you want) */ 
} 
if (strcmp(s1,s2)==0){ /* do si1 and s2 hold the same characters? */ 


} 
函数 stremp( ) 对 字符 囊 进行 三 路 比较 。 如 上 面 程序 所 示 , 对 于 给 定 的 字符 申 参 数 sl 和 s2 ，stremp 
(sl,s2) 返 回 0 表示 两 个 字符 串 完 全 相等 。 如 果 在 字典 序 中 , sl 位 于 s2 之 前 ,stremp 会 返回 一 个 


负数 , 如果 sl 位 于 s2 之 后 , 返回 一 个 正 数 。 例 如 : 
stremp("dog","dog")==0 
stremp("ape","dodo")<0 /* “ape” comes before “dodo” in a dictionary */ 
stremp("pig',"cow')>0 /* “pig” comes after “cow’” in a dictionary */ 


字符 串 指针 的 比较 sl ==s2 也 不 一 定 得 到 0(false) 。 因 为 某 些 实现 可 能 将 所 有 相同 内 容 的 字符 串 只 
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保存 一 份 , 这 样 sl 和 s2 会 指向 相同 内 存 空间 , 于 是 比较 的 结果 是 1(true) 。 因 此 , 使 用 stomp( ) 才 是 
正确 的 C 风格 字符 串 比 较 方 法 。 度 

晒 数 strlen( ) 用 来 获得 C 风格 字符 串 的 长 度 ， 

int lgt = strlen(s1); 
注意 , 长 度 不 包括 结尾 的 0。 在 本 例 中 ， ee =4, 但 sl 实际 占用 了 5 个 字 节 来 保存 “asdf”。 
这 个 微小 的 差别 是 很 多 差 一 位 错误 的 根源 。 i 

我 们 还 可 以 复制 C 风格 字符 串 ( 结 尾 的 0 也 会 被 复制 ) ; 

strcpy(s1,s2); /* copy characters from s2 into s1 */ 

你 (调用 者 ) 应 该 保证 目标 字符 串 ( 数 组 ) 有 足够 的 空间 容纳 源 字符 串 中 的 字符 。 

晒 数 stmcpy( ) 、strncat( ) 和 stmcmp( ) 是 strepy( ) 、strcat( ) 和 stremp( ) 限定 处 理 长 度 的 版 本 ， 
第 三 个 参数 n 指出 了 最 多 处 理 多 少 个 字符 。 注 意 , 如 果 源 字符 串 中 的 字符 不 足 n 个 ,strmcpy( ) 不 
会 复制 结尾 的 0, 因此 得 到 的 结果 是 一 个 非法 的 C 风格 字符 串 。 

盟 数 strchr( ) 和 strstr( ) 在 第 一 个 参数 (一 个 字符 串 ) 中 搜索 第 二 个 参数 (字符 或 字符 串 ) , 并 
退回 匹配 的 位 置 。 与 find( ) 类 似 , 它们 从 左 至 右 搜索 。 

令 人 惊奇 的 是 这 些 简单 的 函数 能 完成 很 多 功能 , 同样 令 人 惊奇 的 是 使 用 这 些 函 数 非常 容易 出 
现 小 的 错误 。 考 虑 这 么 一 个 简单 问题 : 将 用 户 名 和 地 址 字符 串 连 接 起 来 , 之 间 加 入 一 个 @ 。 在 
C++ 中 , 可 以 使 用 std :: string: 

string s = id + '@'’ + addr; 

使 用 C 风格 字符 串 , 我 们 可 以 这 样 写 : 
char* cat(const char* id, const char* addr) 

{ 

int sz = strlen(id)+strlen(addr)+2; 
char* res = (char*) malloc(sz); 
strcpy(res,id); 

res[strlen(id)+1] = '@'; 
strcpy(reststrlen(id)+2,addr); 
res[sz—1]=0; 


return res; 


) 
这 段 代码 是 正确 的 吗 ? 会 有 人 释放 cat( ) 返回 的 字符 串 吗 ? 
试 一 试 测试 cat( )。 为 什么 计算 新 字符 串 的 长 度 时 要 加 2? 我 们 在 cat( ) 留 下 了 一 
个 初学 者 常 犯 的 错误 , 找到 并 修正 它 。 我 们 “忘记 ” 写 注释 了 。 请 添加 注释 , 假定 读者 了 
解 标准 C 字符 串 有 函数。 
27.5.1 C 风格 字符 串 和 const 
考虑 下 面 代 码 : 


char* p = "asdf"; 
pI2] = 'x'; 


这 段 代码 在 C 中 是 合法 的 , 但 在 C++ 中 不 合法 。 在 C++ 中 , 一 个 字符 串 文字 常量 被 视 为 常量 ， 
是 不 可 更 改 的 , 因此 p[2] ='x'( 将 p 指 向 的 内 容 改 为 "asxf" ) 是 非法 的 。 不 幸 的 是 , 很 少 有 编译 
器 能 捕获 这 个 错误 ,导致 出 现 问题 。 如 果 你 足够 幸运 的 话 , 程序 运行 时 会 产生 一 个 错误 , 但 你 不 
能 期 望 总 是 这 么 幸运 , 有 可 能 产生 更 为 严重 的 后 果 。 你 应 该 这 样 编写 代码 : 

const char* p="asdf";  //now you can't write to "asdf' through p 


我 们 建议 在 C 和 C++ 中 都 这 样 编写 程序 。 
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C 的 strchr( ) 函数 有 一 个 相似 但 更 难以 发 现 的 问题 。 考 虑 如 下 代码 : 


char* strchr(const char® s, int c);/* find c in constant s (not C++) */ 


const char aa[] = "asdf"; /* aa is an array of constants */ 
char* q = strchr(aa, 'd'); f* finds ‘d' */ 
“qx ; /* change 'd in aa to 'x' */ 


这 段 代 码 在 C 和 C++ 中 都 是 非法 的 , 但 C 编译 器 不 能 捕获 这 个 错误 。 这 种 错误 优势 被 称 为 递 变 
(transmutation) : 它 把 const 类 型 变 为 非 const 类 型 ， 违反 了 对 代码 的 合理 假设 。 
在 C++ 中 , 可 以 用 标准 库 声 明 的 另 一 个 strchr( ) 函数 : 


char const* strchr(const char* s, int c); /find cin constant 5 
char* strchr(char* s, int c); jfindcins 


函数 strstr( ) 也 存在 同样 问题 。 
27. 5.2 字 节 操作 


在 遥远 的 黑暗 时 代 (1980 年 代 早期 ) ， 当 时 void” 尚未 发 明 ，C( 和 C++ ) 程 序 员 只 能 使 用 字符 
串 操作 来 处 理 字 节 。 现 在 的 标准 库 中 已 经 有 了 基本 的 内 存 处 理 函 数 , 它们 接受 void 型 参数 , 返 
回 void* 型 值 , 以 此 来 警告 用 户 一 一 它们 直接 处 理 内 存 , 因此 本 质 上 讲 处 理 对 象 应 该 是 无 类 型 的 
内 存 数据 。 


/* copy n bytes from s2 to s1 {like strcpy): */ 
void* memcpy(void* s1, const void* s2, size_t n); 


/* Copy n bytes from s2 to s1 ( [st:s1+n) may overlap with [s2:52+n) ): */ 
void* memmove(void* s1, const void* s2, size_t n); 


f/f* compare n bytes from s2 to s1 (like strcmp): */ 
int memcmp(const void* s1, const void* s2, size_t n); 


f* find c (converted to an unsigned char) in the first n bytes of s: */ 
void* memchr(const void* s, int c, size_t n); 


f/* copy c (converted to an unsigned chan) 
into each of the first n bytes that s points to: */ 
void* memset(void* s, int c¢, size_t n); 


不 要 在 C++ 中 使 用 这 些 函 数 。 特 别 是 memset( ) , 它 会 干扰 构造 函数 的 正常 工作 。 
27. 5.3 实例 : strcpy( ) 

strcpy( ) 的 定义 应 该 是 为 人 们 所 熟知 的 了 , 但 它 作 为 CC( 和 C++ ) 简 洁 性 范例 的 一 面 , 就 不 那 
么 为 人 所 知 了 : 


char* strcpy(char* p, const char* q) 


while (“p++ = *q++); 
return p; 


} 
为 什么 这 段 代 码 的 确 将 C 风格 字符 串 q 的 内 容 复制 到 p 中 , 留 给 大 家 思考 。 
试 一 试 这 个 strepy() 的 实现 正确 吗 ? 解释 为 什么 。 
如 果 你 不 能 解释 为 什么 , 我 们 认为 你 还 不 是 一 个 C 程序 员 ( 不 过 你 可 能 是 合格 的 其 他 语言 
程序 员 ) 。 每 种 语言 都 有 自己 的 风格 特色 , 这 就 是 C 的 特色 。 
27. 5. 4 ”一 个 风格 问题 
对 一 个 常常 引起 激烈 争论 的 , 很 大 程度 上 与 程序 设计 本 身 无 关 的 风格 问题 , 我 们 已 经 默默 地 


文 持 很 长 时 间 了 。 我 们 可 以 定义 指针 类 型 如 下 : 

char* p; /pis a pointer to a char 
而 不 是 这 样 定义 : 

char *p; f* pis something that you can dereference to get a char */ 
空格 放 在 哪里 对 于 编译 器 来 说 毫 无 意义 , 但 是 程序 员 却 很 在 意 。 我 们 的 风格 (在 C++ 中 很 常见 ) 
强调 变量 的 类 型 , 而 第 二 种 风格 (在 C 中 很 常见 ) 强 调 对 指针 变量 的 使 用 。 注 意 , 我 们 并 不 推荐 在 
一 条 语句 中 声明 很 多 变量 ， 

char cy “p, a[177], *f(); / legal, but confusing */ 
这 种 声明 语句 在 老式 程序 中 并 不 罕见 。 我 们 建议 用 多 条 语句 来 声明 这 些 变 量 , 并 利用 每 行 剩余 的 
空间 添加 注释 和 初始 化 代码 : 

charc='a'; /* termination character for input using f0 */ 

char* p=0; /* last char read by f0 */ 


char a[177] /* input buffer */ 
char* f();  /* read into buffer a; return pointer to first char read */ 


而 且 , 应 该 为 变量 取 更 有 意义 的 名 字 。 
27.6 输入 /输出 : stdio 


C 中 没有 iostream， 因 此 我 们 使 用 < stdio. h > 中 定义 的 C 标准 WO, 这 组 特性 通常 称 为 标准 / 
0(stdio) 。stdio 中 与 cin 和 cout 等 价 的 是 stdin 和 stdout。 在 一 个 程序 中 , 可 以 (对 相同 的 0 流 ) 
混合 使 用 stdio 和 iostream, 但 我 们 不 推荐 这 么 用 。 如 果 你 觉得 需要 混合 使 用 , 请 查阅 专家 级 的 参 
考 书籍 中 有 关 stdio 和 iostream( 特别 是 ios_base :: sync_with_stdio( ) ) 的 详细 介绍 。 参 见 附录 B. 10。 
27.6.1 输出 

最 常用 也 最 有 用 的 stdio 函数 是 printf( ) , 它 的 最 基本 的 用 途 是 打印 (C 风格 ) 字 符 串 ; 

夫 nclude<stdio.h> 

ee f(const char* p) 


printf("Hello, Worldi\n"); 
printf(p); 
} 
这 个 例子 不 是 那么 有 趣 。 有 趣 的 一 点 是 printf( ) 能 够 接受 任意 数量 的 参数 , 第 一 个 参数 (一 个 字符 
串 ) 控 制 其 后 的 参数 如 何 打 印 。C 中 printf( ) 的 定义 如 下 所 示 : 
int printf(const char* format, . . . ); 
“... 的 含义 是 "可 以 有 更 多 参数 " 。 我 们 可 以 这 样 调用 printf( ) ， 
void fi(double d, char* s int i, char ch) 
| printf("double %g string %s int %d char Won", d, s, i, ch); 
} 
这 里 , %g 表示 “用 一 般 格 式 打 印 一 个 浮 点 值 ”, %s 表示 “打印 一 个 C 风格 字符 串 ”,%d 表示 “以 
十 进 制 格 式 打 印 一 个 整数 ”, %c 表示 “打印 一 个 字符 " 。 每 个 格式 限定 符 都 打印 下 一 个 未 处 理 的 
参数 , 因此 %g 打印 d, %s 打印 s, %d 打印 i, %e 打印 ch。 附录 B. 10. 2 中 给 出 了 printf( ) 的 完整 
格式 限定 符 列表 。 
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char a[] = { at 由 }; As no terminating 0 */ 


void f2(char* s, int i) 


{ 
printf("goof %s\n", i); /* uncaught error */ 
printf("goof 9%d: %s\n",); /* uncaught error */ 
printf("goof %s\n", a); /* uncaught error */ 
) 


最 后 一 个 printf( ) 的 效果 很 有 趣 : 它 会 打印 a[ 1 ] 之 后 内 存 中 的 每 个 字 节 (字符 ), 直至 遇 到 0 为 止 。 
打印 出 的 字符 数目 可 能 非常 非常 多 。 
虽然 stdio 在 C 和 C++ 中 都 能 正常 工作 , 但 由 于 缺少 类 型 检查 , 我 们 更 倾向 于 使 用 iostream。 倾 
向 于 iostream 的 另 一 个 原因 是 stdio 隔 数 没有 扩展 性 ; 你 无 法 扩展 printf( ) 来 输出 自 定义 类 型 ,而 使 用 
iostream 是 可 以 做 到 这 点 的 。 例 如 , 你 没 办 法 定义 新 的 格式 限定 符 %YY 来 输出 自 定义 类 型 stmct Y。 
printt( ) 还 有 一 个 很 有 用 的 版 本 , 可 以 向 文件 中 打印 数据 : 
int fprintf(FILE* stream, const char* format, .. . ); 
例如 


fprintf(stdout,"Hello, Worldi\n"); // exactly like printf"Hello, Worldi\n®; 
FILE* ff = fopen("My_file","w");  //open My _file for writing 


fprintf(ff,"Hello, World!\n"); // write "Hello, Worldi\n" to My _file 
第 一 个 参数 是 一 个 文件 句柄 (文件 描述 符 ) , 文件 句柄 将 在 27. 6.3 节 中 介绍 。 
27. 6.2 输入 

最 常用 的 stdio 输入 晴 数 包括 : 

int scanf(const char* format,...);  /* read from stdin using a format */ 

int getchar(void); f/* get a char from stdin */ 

int getc(FILE* stream); /* get a char from stream */ 

char* gets(char* s); /* get characters from stdin */ 
最 简单 的 读 取 字符 串 的 方式 是 使 用 gets( ) , 例如: 

char a[12]; 


gets(a);  /* read into char array pointed to by a until a \n' is input */ 

但 是 , 不 要 这 样 编写 程序 ! gets( ) 是 有 害 的 ! 曾经 有 大 约 1/4 的 成 功 黑 客 攻 击 是 由 于 gets( ) 和 它 
的 近亲 scanf("%s" ) 的 漏洞 造成 的 。 到 现在 为 止 , 这 仍然 是 一 个 主要 的 安全 问题 。 以 上 面 简单 的 
程序 为 例 , 你 如 何 知道 在 换行 之 前 用 户 最 多 输入 11 个 字符 呢 ? 你 是 无 法 知道 的 。 因 此 ，gets( ) 几 
乎 肯定 会 导致 内 存 破 坏 (缓冲 区 之 后 的 内 存 空 间 ) ,而 内 存 破 坏 目前 仍 是 黑客 的 主要 工具 之 一 。 不 
要 认为 你 可 以 猜测 一 个 最 大 缓冲 区 规模 , 能 “对 所 有 用 户 都 足够 大 ”。 也 许 在 输入 流 男 一 端的 那个 
“人 ”只 是 一 个 程序 , 它 会 打破 你 的 合理 假设 。 / 

函数 scanf( ) 使 用 类 似 printf( ) 的 格式 限定 串 来 指定 输入 格式 。 其 使 用 与 pimtf( ) 一 样 方便 : 


void ff 
{ 
int i; 
char c; 
double d; 


char* s = (char*)malloc(100); 
/* read into variables passed as pointers: */ 
scanf("%i 9oc %g %s", &i, &c, &d, s); 
/* %s skips initial whitespace and is terminated by whitespace */ 
} : 
与 printf( ) 类 似 ,scanf( ) 也 不 是 类 型 安全 的 。 格 式 字 符 串 和 参数 ( 指针) 必须 严 格 匹配 , 否则 在 运 
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行 时 就 会 产生 奇怪 的 结果 。 而 且 ,%s 将 字符 串 读 和 人 s 的 过 程 中 还 会 发 生 溢出 。 因 此 , 永远 不 要 
使 用 gets( ) 或 scanf("%s")! 
那么 如 何 才 能 安全 地 读 取 字符 呢 ? 我 们 可 以 在 格式 限定 符 %s 中 指定 要 读 取 的 字符 的 数目 , 例如 : 


char buf[20]; 
scanf("%19s",buf); 


我 们 需要 为 结尾 的 0 留 出 存储 空间 ， 因 此 能 读 入 buf 的 最 大 字符 数 为 19。 但 是 , 这 又 引起 一 个 新 
的 问题 : 如 采用 户 输 入 的 字符 数 超过 了 19 个 , 应 该 怎么 办 呢 ? scanf( ) 的 处 理 方式 是 将 多余” 的 
字符 留 在 输入 流 中 ,随后 的 输入 操作 可 能 会 发现” 这 些 字 符 。 

由 于 scanf( ) 存 在 这 些 问 题 ， 一 般 来 说 更 为 谨慎 也 更 为 容易 的 方法 是 使 用 getchar( ) 。 使 用 
getchar( ) 读 取 字 符 的 一 般 方法 如 下 : 


while((x=getchar())!=EOF) { 
ye | 
} 
EOF 是 一 个 stdio 宏 , 它 表 示 ”文件 尾 " 的 含义 ,参见 27.4 节 。 


C++ 标准 库 中 的 流 与 scanf("%s") 和 get( ) 功 能 类 似 , 但 不 存在 上 述 问题 : 


string s; 

cin >> s; AH read a word 

getline(cin,s); // read a line 
27. 6.3 文件 


在 C( 或 C++ ) 中 , 可 以 使 用 fopen( ) 打 开 文件 , 使 用 fclose( ) 关 闭 文件 。 这 些 函 数 与 文件 描述 
符 结构 FILE 及 EOF 宏 ( 文 件 尾 ) 都 定义 在 < stdio. h > 中 : 


FILE *fopen(const char* filename, const char* mode); 
int fciose(FILE *stream); 


你 可 以 这 样 使 用 文件 : 
void f(const char* fn, const char* fn2) 
{ 
FILE* fi = fopen(fn, "r"); /* open fn for reading */ 
FILE* fo = fopen(fn2, "w"); /* open fn for writing */ 


if (fi == 0) error("failed to open input file"); 
if (fo == 0) error("failed to open output file"); 


f* read from file using stdio input functions, e.g., getc() */ 
/* write to file using stdio output functions, e.g., fprintf() */ 


fclose(fo); 
fclose(fi); 
} 
考虑 这 样 一 个 问题 : C 中 没有 异常 机 制 , 那么 在 发 生 错误 的 情况 下 , 我 们 如 何 保证 文件 确实 被 关闭 了 ? 
27.7 常量 和 宏 


在 C 中 , const 绝 不 是 编译 时 常量 : 
const int max = 30; 
const int x; /* const not initialized: OK in C (error in C++) */ 


void f(int v) 


int al[max]; /* error: array bound not a constant (OK in C++) */ 
/* (max is not allowed in a constant expression!) */ 
int a2[x]; f* error: array bound not a constant */ 
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Switch (v) { 
case 1: 


case max:  /* error: case label not a constant (OK in C++) */ 


} 


在 C 中 这 样 规定 (与 C++ 不 同 ), 是 因为 考虑 到 技术 上 的 原因 : const 隐 含 地 可 被 所 有 源 文件 访问 ， 
例如 : 


f° file x.c: */ 
const int x; Am initialize elsewhere */ 


f° file xx.c: */ 
const int x = 7; /* here js the real definition */ 


在 C++ 中 , 这 是 两 个 不 同 的 对 象 , 名 字 都 是 x, 作用 域 在 自己 的 文件 中 。C 程序 员 不 是 用 const 来 
表示 符号 常量 , 他 们 更 愿意 使 用 宏 。 例 如 : 


#define MAX 30 
void f(int v) 
{ 
intal{MAX]; /*OK™*/ 


switch (v) { 

case 1: 
/me 
break; 

case MAX: ”OK™*/ 
1 
break; 

} 

} 


程序 中 凡是 使 用 宏 MAX 的 地 方 , 都 被 替换 为 文本 30( 宏 的 值 )。 也 就 是 说 ,al 的 元 素数 目 为 30， 
第 二 个 case 语句 的 值 也 是 30。 我 们 为 宏 取 名 时 使 用 了 全 部 大 写 的 字符 串 MAX, 这 是 C 语言 的 惯 
例 。 这 种 命名 习惯 有 助 于 减少 宏 引 起 的 错误 。 


27.8 宏 


使 用 宏 的 时 候 一 定 要 小 心 : 在 C 中 没有 真正 有 效 的 方法 来 避免 使 用 宏 , 但 宏 带 有 严重 的 副 作 
用 , 因为 宏 不 遵守 通常 的 C( 或 C++ ) 作 用 域 和 类 型 规则 一 一 它 只 是 一 种 文本 替换 而 已 。 参 见 附 
录 A. 17.2。 

除了 尽量 不 用 宏 (使 用 C++ 中 的 替代 方法 ) 之 外 , 我 们 还 有 什么 办 法 来 避免 宏 引 起 的 问题 吗 ? 

。 所 有 宏 名 都 全 部 大 写 。 

。 不 是 宏 的 结构 不 要 使 用 全 部 大 写 的 名 字 。 

。 不 要 为 宏 取 短 的 或 有趣” 的 名 字 , 如 max 或 min。 

。 期 望 其 他 人 也 遵守 上 述 简单 而 常见 的 规范 。 

宏 的 主要 用 途 包括 : 

。 定义 “常量 。 

。 定义 类 似 函 数 的 结构 。 


es。 “改进 语法 。 

。 控制 条 件 编译 。 

另外 还 有 其 他 很 多 不 太 和 常见 的 用 途 。 

我 们 认为 宏 被 过 度 使 用 了 , 但 在 C 程序 中 , 还 没有 一 种 合理 而 完整 的 替代 方法 。 甚 至 在 C++ 程 
序 中 也 很 难 避 免 使 用 宏 (特别 是 当 你 编写 的 程序 需要 移植 到 很 老 的 编译 器 上 或 者 有 特殊 限制 的 平 
台 上 时 )。 

对 于 那些 认为 下 面 介绍 的 技术 是 “低级 手段 ”", 不 应 该 在 此 提 及 的 人 , 我 们 要 说 声 抱 菊 了 。 因 
为 我 们 认为 这 种 编程 技术 是 现实 世界 中 真实 存在 的 ,而 且 我 们 所 选择 的 这 些 ( 很 温和 的 ) 例子 展示 
了 宏 的 正确 使 用 和 不 正确 使 用 , 可 以 帮助 初学 者 避免 长 时 间 陷 入 困境 。 对 宏 的 无 知 会 融 来 不 笠 。 
27. 8.1 类 函数 宏 

下 面 是 一 个 非常 典型 的 类 也 数 宏 : 

#define MAX(x, y) ((x)>=(y)? (x): (y)) 
我 们 为 宏 取 名 为 全 大 写字 母 的 MAX, 以 便 与 (各 种 程序 中 ) 党 用 的 函数 名 max 区 别 开 来 。 显 然 , 它 
与 琐 数 还 是 有 很 大 区 别 的 : 没有 参数 类 型 、 没 有 语句 块 、 没 有 返回 语句 等 。 男 外 ， 宏 定义 中 的 那 


些 括号 是 起 什么 作用 的 ? 考虑 如 下 代码 : 
int aa = MAX(1,2)， 
double dd = MAX(aa++,2); 
char cc = MAX(dd,aa)+2; 


int aa = ((1)>=( 2)?(1): (2)); 
double dd = ((aa++)>=(2)?( aat++): (2)); 
char cc = ((dd)>=(aa)? (dd): (aa))+2; 


如 果 在 宏 定义 中 没有 使 用 “那些 括号 ”, 最 后 一 条 语句 会 扩展 为 : 


char cc = dd>=aa?dd:aat+2; 
也 就 是 说 , cc 的 值 将 和 你 根据 其 定义 推断 出 的 值 不 同 。 这 个 例子 说 明 , 在 宏 的 定义 中 , 使 用 任何 
参数 时 都 应 将 其 置 于 括号 之 中 ( 当做 表达 式 )。 

另 一 方面 , 对 于 第 二 条 语句 , 使 用 再 多 括号 也 解决 不 了 问题 。 宏 参数 x 被 替换 为 aa ++ ,由 于 x 
在 MAX 使 用 了 两 次 , 因此 x 进行 了 两 次 增 1 运算 。 记 住 , 不 要 向 宏 传递 可 能 引起 副作用 的 参数 。 

某 些 天 才 可 能 碰巧 定义 了 这 样 有 问题 的 宏 , 并 将 其 放 入 了 被 广泛 使 用 的 头 文件 中 。 更 不 笠 的 
是 , 他 还 将 宏 命 名 为 max 而 不 是 MAX, 这 样 ， 当 C++ 标准 头 文件 中 定义 下 面 函 数 时 

tempiate<cijass T> inline T max(T a,T b) { return a<b?b:a; } 
max(T a, Tb) 就 会 被 扩展 , 在 编译 器 看 来 , 语句 变 为 : 

template<class T> inline T ((T a)>=(Tb)?(Ta):(Tb)){return a<b?b:a; } 
编译 器 给 出 的 错误 信息 会 非常 有趣 ”， 对 程序 员 修正 错误 豪 无 帮助 。 如 果 遇 到 这 种 紧急 情况 ,你 
可 以 “取消 定义 ”(undefine ) 宏 : 


#undef max 
季 运 的 是 ， 这 个 宏 并 不 是 那么 重要 。 但 是 , 在 那些 广泛 应 用 的 头 文件 中 有 成 千 上 万 个 宏 , 不 可 能 
取消 每 个 宏 都 不 引起 混乱 。 

并 不 是 所 有 宏 参 数 都 被 用 作 表 达 式 , 例如 : 

#define ALLOC(T,n) ((T*)malloc(sizeof(T)*n)) 
这 是 来 自 实际 程序 中 的 例子 , 内 存 分 配 时 sizeof 中 使 用 的 类 型 与 所 需 类 型 可 能 不 匹配 , 这 个 宏 对 
避免 此 类 错误 很 有 用 : 
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double* p = malloc(sizeof(int})*10); /* likely error */ 
不 幸 的 是 , 如 果 希 望 宏 还 能 捕获 内 存 耗 尽 错 误 , 就 不 那么 好 办 了 。 假 如 已 经 定义 了 error_var 和 er- 
ror( ) ,可 以 这 样 定 义 宏 : 
#define ALLOC(T,n) (error_var = (T*)malloc(sizeof(M*n), \ 
(error_var==0)\ 


?(error("memory allocation failure’),0)\ 
:error_var) 


行 结 尾 处 的 “\” 并 非 输 入 错误 , 将 一 个 较 长 的 宏 分 成 几 行 , 就 必须 在 非 结 尾行 的 最 后 加 上 “\”。 如 
果 你 使 用 C++ 编写 程序 , 我 们 建议 还 是 使 用 new。 
27. 8.2 语法 安 

你 可 以 定义 这 样 一 类 宏 , 它们 能 使 源 程序 形式 上 更 符合 你 的 偏好 , 例如 : 

#define forever for(;;) 

#define CASE break; case 


#define begin { 
#define end } 


我 们 强烈 建议 不 要 使 用 这 种 宏 。 很 多 人 已 经 尝试 过 这 种 方法 了。 他 们 (以 及 他 们 编写 出 的 代码 的 
维护 人 员 ) 发现: 

。 对 于 “好 的 语法 ”, 很 多 人 的 理解 是 不 一 样 的 。 

。“ 改 进 的 语法 ”是 不 标准 的 、 奇 怪 的 , 会 令 他 人 困惑 。 

。 有 过 “改进 语法 ”导致 难以 发 现 的 编译 错误 的 先例 。 

。 你 所 看 到 的 并 非 编译 器 所 看 到 的 , 编译 器 是 根据 它 所 知道 的 (以 及 在 源 程序 中 所 看 到 的 ) 

词汇 报告 错误 , 而 不 是 根据 你 所 知 及 你 所 见 。 

因此 , 不 要 使 用 语法 宏 “ 改 进 ” 代 码 外 观 。 你 和 你 的 好 朋友 可 能 觉得 效果 很 棒 , 但 经 验 表明 ,你 
只 是 大 社区 中 的 一 分 子 而 已 , 因而 其 他 人 将 不 得 不 重 写 你 的 代码 (假如 你 的 代码 还 “活着 ”的 话 )。 
27. 8. 3 条 件 编译 

假设 某 个 头 文件 有 两 个 版 本 ， 比 如 说 一 个 是 Linux 版 , 另 一 个 是 Windows 版 。 在 程序 中 你 如 


何 选择 使 用 哪个 版 本 呢 ? 常 用 方法 如 下 : 
#ifdef WINDOWS 
#include "my_windows_header.h" 
#else 
#incilude "my_linux_header.h" 
#endif 


现在 , 如 果 有 人 在 编译 之 前 定义 了 宏 WINDOWS, 则 效果 为 : 


#include "my_windows_header.h" 


否则 , 效果 为 : 


#nclude "my_linux_header.h" 
提 fdef WINDOWS 并 不 关心 WINDOWS 被 定义 为 什么 , 它 只 关心 WINDOWS 是 否 被 定义 。 

很 多 大 型 系统 (包括 所 有 操作 系统 ) 都 会 定义 类 似 WINDOWS 这 样 的 宏 ， 以 供 你 检测 。 我 们 可 
以 这 样 来 检测 程序 是 在 被 C++ 编译 器 编译 还 是 在 被 C 编译 器 编译 : 


#fdef __cplusplus 
HA in C++ 
#else 
rinC*/ 
#endif 


还 有 一 种 类 似 的 结构 , 通常 被 人 们 称 为 包含 保护 (include guard) , 常常 用 来 防止 头 文件 被 包含 多 次 : 
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fr* my_windows_header.h: */ 
#ifndef MY_WINDOWS_HEADER 
#define MY_WINDOWS_HEADER 

f” here is the header information */ 
#endif 


#ifndef 检测 宏 是 否 未 被 定义 , 即 它 与 扩 fndef 是 相对 的 。 逻 辑 上 , 用 于 源 文件 控制 的 宏 与 其 他 修改 
源码 ( 宏 苦 换 ) 的 宏 有 很 大 不 同 。 它 们 只 是 使 用 了 相同 的 下 层 语言 机 制 而 已 。 


27.9 实例 : 侵入 式 容器 


C++ 标准 库容 器 (如 vector 和 map) 是 非 侵 人 式 容 器 (non-intmusive container) : 即 它们 不 要 求 容 
器 内 的 数据 以 单个 元 素 的 形式 被 访问 ， 而 是 对 容器 整体 进行 操作 。 这 也 是 它们 为 什么 有 那么 好 的 
通用 性 一 一 适用 于 所 有 内 置 类 型 和 用 户 目 定 义 类 型 ， 只 要 类 型 文 持 复制 操作 即 可 。 另 外 一 类 容器 
被 称 为 侵入 式 容器 (intrusive container), 在 C 和 C++ 中 都 很 常用 。 下 面 我 们 将 通过 一 个 非 侵 入 式 
的 容器 来 说 明 C 风格 struct、 指 针 和 动态 内 存 分 配 的 使 用 。 - 

我 们 可 以 定义 一 个 支持 如 下 9 个 操作 的 双向 链表 : 


void init(struct List* Ist); fr initialize lst to empty */ 
struct List* create(); /* make a new empty list on free store */ 
void clear(struct List* lst); n* free all elements of lst */ 


void destroy(struct List* lst); free all elements of |st, then free |st */ 


void push_back(struct List* lst struct Link* p); /* add p at end of |st */ 
void push_front(struct List*, struct Link* p); rf add p at front of |st */ 


/* insert q before p in lst: */ 
void insert(struct List* lst, struct Link* p, struct Link* q); 
struct Link* erase(struct List* lst, struct Link* p); /* remove p from lst */ 


f* return link n “hops” before or after p: */ 

struct Link* advance(struct Link* p, int n); 
基本 设计 思路 是 使 用 户 只 需 提供 List* 和 Link * 指针 就 能 完成 这 些 操作 。 这 意味 着 可 以 大 幅度 修 
改 这 些 操作 的 实现 ， 而 无 需 修改 用 户 程序 。 显 然 , 我 们 在 命名 上 受到 了 STL 的 影响 。List 和 Link 


显然 可 以 简单 定义 如 下 : 

struct List { 
struct Link* first; 
struct Link* last; 

}; 

struct Link{ CC/* link for doubly-linked list */ 
struct Link* pre; 
struct Link* suc; 


}; 
下 面 是 List 的 图 示 : 
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我 们 目的 不 是 介绍 高 明 的 描述 技术 或 者 高 明 的 算法 ,因此 本 节 并 未 展示 这 些 。 但 是 ,请 注意 程序 
中 并 未 提 及 Link 所 保存 的 数据 ( List 中 的 元 素 ) 。 回 过 头 看 一 下 程序 , 我 们 发 现 Link 和 List 非常 
像 抽象 类 。Link 保存 的 数据 会 随后 提供 。Link* 和 List* 有 时 称 为 不 透明 类 型 处 理工 具 ， 即 我 们 可 
以 在 不 了 解 Link 和 List 的 内 部 结构 的 情况 下 , 使 用 Link ”和 List* 来 处 理 List 中 的 元 素 。 

为 了 实现 List 隔 数 , 我 们 首先 要 #include 一 些 标准 库 头 文件 : 

#include<stdio.h> 


#include<stdlib.,h> 
机 nclude<assert.h> 


C 不 支持 名 字 空 间 ,， 因此 我 们 不 必 担 心 using 声明 或 者 using 指令 的 问题 。 另 一 方面 , 我 们 应 该 担 
心 的 可 能 是 那些 非常 常见 的 简单 名 字 (Link 、insert、init 等 ) ， 因 此 这 组 函数 不 应 在 这 个 玩具 程序 
之 外 使 用 。 

初始 化 代码 很 简单 , 但 注意 assert( ) 的 使 用 : 


void init(struct List* Ist}  /* initialize *p to the empty list */ 
{ 

assert(lst); 

lst-—>first = lst->last = 0; 


} 
我 们 决定 在 运行 时 不 处 理 非法 链表 指针 错误 。 通 过 使 用 assert( ) , 我 们 只 是 对 空 链表 指针 给 出 一 
个 (运行 时 ) 系 统 错误 。“ 系 统 ” 错 误会 给 出 失败 的 assert( ) 所 在 的 文件 名 和 行 号 ; assert( ) 是 在 
< assert. h > 中 定义 的 宏 , 其 检测 只 在 调试 状态 下 才 执行 。 由 于 C 语言 不 支持 异常 ,处 理 非法 指针 
是 很 困难 的 。 

函数 create( ) 简单 地 在 动态 内 存 空间 中 创建 一 个 List。 它 在 某 种 程度 上 可 以 看 做 构造 函数 
(init( ) 进 行 初始 化 ) 和 new( malloc( ) 完成 内 存 分 配 ) : 


struct List* Create() ~* make a new empty list */ 

{ 

struct List* ist = (struct List*)}malloc(sizeof(struct List*)); 
init(lst); 

return |st; 


} 
盟 数 clear( ) 假定 所 有 Link 的 内 存 空间 都 是 动态 分 配 的 , 因此 用 free( ) 来 释放 : 


void clear(struct List* lst) /* free all ejements of lst */ 


assert(lst); 
{ 
struct Link* curr = js 僵 >first; 
while(curr) { 
struct Link* next = Curr 一 >Suc; 
free(curr); 
curr = next; 


} 
lst—>first = lst->last = 0; 
} 
} 


注意 我 们 使 用 Link 成 员 suc 的 方法 。 如 果 一 个 对 象 已 经 被 释放 了 , 我 们 是 无 法 安全 访问 其 成 员 
的 。 因 此 , 在 释放 一 个 Link 时 , 我 们 引入 变量 next, 保存 所 处 的 列表 位 置 。 

如 果 我 们 并 不 是 在 动态 内 存 空 间 中 分 配 全 部 Link, 那么 最 好 不 要 调用 clear( ) 来 释放 链表 内 
存 空间 ,否则 会 造成 很 大 的 混乱 。 
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destroy( ) 本 质 上 与 create( ) 是 相对 的 , 也 就 是 说 , 它 是 析 构 函数 和 delete 的 结合 : 


void destroy(struct List* lst) /* free al elements of lst then free lst */ 


{ 
assert(lst); 
clearl(lst); 
free(lst); 
) | 


注意 , 我们 没有 准备 为 链表 元 素 调用 清理 函数 ( 析 构 函数 ) 。 也 就 是 说 , 目前 的 设计 并 非 是 C++ 
技术 和 普遍 方法 的 准确 模拟 , 实际 上 , 我 们 不 能 也 不 必 这 样 做 。 

晴 数 push_back( ) 的 设计 思路 非常 直接 一 一 向 链表 中 添加 一 个 Link, 作为 新 的 表 尾 : 

void push_back(struct List* lst, struct Link* p)  /*addpatendoflst*/ -2 

{ 


assert(lst); 


{ 





struct Link* [ast = lst—>last; 

if (last) { | 
last->suc = p; /* add p after last *#/ 
p->pre = last; 


} 

else { 有 
lst—>first = p; /* pis the first element */ 
p->pre =0; 

} 

Ist—>last = p; /* p is the new last element */ 

p->suc = 0; ea 


} 
} : 


但 是 , 如 果 我 们 不 在 草稿 纸 上 夯 一 些 方块 (链表 节点 ) 和 箭头 (链表 指针 ) , :来 分 析 链 表 的 操作 方 
式 , 是 很 难 直 接 写 出 正确 的 代码 的 。 注 意 , 在 上 述 代码 中 , 我 们 “忘记 ”考虑 了 参数 p 为 空 的 情况 。 
将 0 而 不 是 一 个 合法 指针 传递 给 Link, 这 跋 代码 就 会 崩溃 。 这 段 代 码 谈 不 上 糟糕 , 但 它 不 是 一 个 
工业 级 别 的 代码 。 其 目的 是 说 明 常 用 的 有 用 的 技术 , 在 本 例 中 , 它 的 另 一 目的 是 展示 一 种 常见 
的 弱点 /bug。 


晃 数 erase( ) 可 以 这 样 编写 : 
struct Link* erase(struct List* lst struct Link* p) 
1 
remove p from lst; 
return a pointer to the jink after p 
{ 
assert(lst); 
if (p==0) return 0; /OK to erase(0) */ 


if (p == Ist~—>first) { 
if (p—>suc) { 


lst—>first = p—>suc; f/* the successor becormes first */ 
p->suc->pre = 0; 
return p 一 >Suc; 


} 

else { 2 
Ist—>first = Ist~->last =0;  /* the list becomes empty be 
return 0; se 

} 
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else if (p == lst~>last) { 
if (p~>pre) { . 
Ist~>last = p->pre; /* the predecessor becomes last */ 
p->pre->suc = 0; 


} 
else{ 
lst~>first = lst->last = 0;  /* the list becomes empty */ 
return 0; 
} 
} 
else { 
p->suc->Ppre = p->pre; 
p->pre->suc = p->suc; 
return p->suc; 
} 


} 
我 们 将 泣 余 函数 的 编写 作为 练习 , 在 我 们 的 非常 简单 的 测试 中 也 用 不 到 这 些 函 数 。 但是, 现在 我 
he i ld 链表 元 率 中 的 数据 在 哪里 ? 例如 , 我 们 想 实现 一 个 保 
存 名 字 (C 风格 字符 串 ) 的 链表 ,应 该 怎么 做 ? 考虑 下 面 代码 : 


struct Name { 
struct Link Ink; ”the Link required by List operations */ 
char* p; /* the name string */ 


}; 
到 目前 为 止 , 一 切 尚 好 ,只 是 我 们 还 没 弄 清 如 何 使 用 Name 的 Link 成 员 。 不 过 由 于 我 们 知道 List 
希望 其 中 的 Link 在 动态 空间 中 分 配 内 存 , 因 此 我 们 可 以 编写 函数 , 在 动态 空间 中 创建 Name: 


struct Name* make_name(char* nm) 

{ 
struct Name* p = (struct Name*)malloc(sizeof(struct Name)); 
p->p=n; 
return p; 


} 
下 图 描述 了 链表 的 结构 : 





下 面 程序 展示 了 其 使 用 方式 : 
int main() 
{ 


int count = 0; 


struct List names; /* make a list */ 
struct List* curr; 
init(&names); 


/* make a few Names and add them to the list: */ 
push_back(&names,(struct Link*)make_name("Norah")); 
push_back(&names,(struct Link*)make_name("Annemarie")); 
push_back(&names, (struct Link*)make_name("Kris")); 


/= remove the second name (with index 1): */ 
erase(&names,advance(names.first,1)); 
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curr = names.first; Cf/* write out all names */ 


for (; curr!=0; curr=curr—>suc) { 
countt++; 
printf("element %d: %s\n", count, ((struct Name®*)curr)—>p); 
} 
} 


可 以 看 出 , 我 们 使 用 了 “欺骗 手段 ”。 我 们 将 Name” 转换 为 Link”。 通 过 这 种 方式 , 用 户 程序 能 够 
获取 “ 库 类 型 "Link。 然 而 ,“ 库 ” 却 不 会 (也 不 必 ) 知道 “用 户 程序 类 型 ”Name。 这 种 方法 是 允许 的 
吗 ? 是 的 , 这 是 允许 的 : 在 C( 和 C++) 中 , 你 可 以 将 一 个 struct 指针 当做 其 第 一 个 成 员 的 指针 来 
处 理 , 反之 亦 然 。 

显然 , 本 例 也 是 合法 的 C++ 程序 。 

试 一 试 ”C++ 程序 员 常 对 C 程序 员 说 的 一 句 话 是 ;:“ 你 所 能 做 的 每 件 事 , 我 都 能 做 
得 更 好 1!1” 请 用 C++ 语 言 重 写 侵 入 式 List 程序 , 来 展示 如 何 用 更 短 、 更 简单 的 代码 实现 相 
同 的 功能 , 又 不 会 物 牲 速度 和 内 存 空间 。 


所 >》 简单 练习 


1. 用 C 语 言 编写 “Hello World1” 程 序 , 编译 、 运 行 它 。 

2. 定义 两 个 变量 , 分 别 保 存 ”Hello” 和 “World!1”, 将 两 个 字符 串 连接 在 一 起 ， 中间 加 入 一 个 空格 , 并 输出 为 
“Hello World!” 。 

3. 定义 一 个 C 函数 , 它 接受 两 个 参数 : 一 个 char” 类 型 , 名 为 p; 另 一 个 为 int 型 ,名 为 x*。 函 数 输 出 两 个 参 
数 的 值 , 形式 为 : p is "foo”and x is 7。 用 一 些 实际 参数 来 测试 这 个 函数 。 

思考 是 

在 下 面 的 题目 中 , 假定 C 表示 ISO 标准 C89。 

. C++ 是 C 的 子 集 吗 ? 

. 谁 发 明了 C? 

.说 出 一 本 获得 极 高 声誉 的 C 教科 书 ? 

. C 和 C++ 是 在 哪个 机 构 中 发 明 出 来 的 ? 

. 为 什么 C++ 与 C( 几 乎 ) 兼 容 ? 

.为 什么 C++ 只 是 与 C 几乎 兼容 ? 

. 列 出 十 几 个 C 不 支持 的 C++ 特性 ? 

. 现在 哪个 组 织 “ 拥 有 ”"C 和 C++? 

. 列 出 6 个 C 中 无 法 使 用 的 C++ 标 准 库 功能 。 

10. 哪些 C 标准 库 功 能 在 C++ 中 使 用 ? 

11. 如 何在 C 中 实现 函数 参数 类 型 检查 ? 

12. 哪些 C++ 特性 相关 的 函数 在 C 中 不 存在 ? 列 出 至 少 3 个 , 并举 实 例 。 

13. 如 何 从 C++ 程序 调用 C 函数 ? 

14. 如 何 从 C 程序 调用 :C++ 函数 ? 

15. 哪些 类 型 的 内 存 布局 在 C 和 C++ 中 是 兼容 的 ? 请 举例 。 

16. 什么 是 结构 标签 ? 

17. 列 出 20 个 C 中 不 存在 的 C++ 关键 字 。 

18. “int x 和 在 C++ 中 是 一 个 定义 吗 ? 在 C 中 呢 ? 

19. 什么 是 C 风格 类 型 转换 ? 它 为 什么 是 危险 的 ? 

20. void* 是 什么 ? 它 在 C 和 C++ 中 有 什么 不 同 ? 

21. 枚 举 类 型 在 C 和 C++ 中 有 什么 不 同 ? 

22. 在 C 中 如 何 才能 避免 常用 名 字 所 引起 的 连接 问题 ? 


‘DO DLR 人 IN 一 


23. 
24. 
25. 
26. 
27. 
28. 
29. 
30. 
31. 
32. 
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C 中 最 常用 的 动态 内 存 空 间 相关 活 数 是 嘱 3 个 ? 
C 风格 字符 串 的 定义 ? 

对 于 C 风格 字符 申 ，== 和 stremp( ) 有 何不 同 ? 
如 何 复制 C 风格 字符 串 ? 

如 何 获得 一 个 C 风格 字符 串 的 长 度 ? 

如 何 复 制 一 个 大 的 int 数组 ? 

printf( ) 的 优点 是 什么 ? 它 的 问题 /局 限 是 什么 ? 
为 什么 永远 不 要 使 用 gets( )? 替代 方法 是 什么 ? 
在 C 中 如 何 打开 一 个 文件 ? 

const 在 C 和 C++ 中 有 何 区 别 ? 


33. 我 们 为 什么 不 喜欢 宏 ? 
34. 宏 的 常见 用 途 是 什么 ? 

. 包含 保护 是 什么 ? z 
人 术语 
#define Dennis Ritchie 非 侵入 式 
#ifdef FILE 不 透明 类 型 
#ifndef es fopen( ) 重 载 
贝尔 实验 室 格式 字符 串 printf( ) 
Brain Kernighan Se 侵 人 式 strcpy( ) 
C/C++ K&R . 结构 标签 
兼容 性 字典 序 三 路 比较 
条 件 编译 连接 void 
C 风格 类 型 转换 宏 void 
C 风格 字符 串 malloc( ) 
二 )》 习题 


对 于 本 章 的 习题 , 最 好 对 所 有 程序 都 同时 在 C 和 C++ 两 种 编译 器 下 编译 。 如 果 只 使 用 C++ 编译 器 ,你 


可 能 无 意 中 使 用 了 C 不 支持 的 特性 。 如 果 只 使 用 C 编译 器 ,类 型 错误 可 能 无 法 被 检测 到 。 


]. 
2. 
3. 


实现 strlen( ) 、strcmp() 和 strcpy( )。 

将 27.9 节 中 的 侵入 式 List 程序 补充 完整 ,并 测试 所 有 函数 。 

尽 可 能 地 “美化 ”27.9 节 中 的 侵入 式 List 程序 , 使 之 更 易 使 用 ; 捕获 /处 理 尽 量 多 的 错误 。 改 变 struct 4 定义 
的 细节 , 使 用 宏 等 方法 都 是 合理 的 。 


4. 为 27.9 节 中 的 侵入 式 List 程序 编写 C++ 版 本 , 并 测试 每 个 函数 。 
5. 比较 习题 3 和 习题 4 的 结果 。 


. 改变 27.9 节 中 Link 和 List 的 实现 ,但 不 改变 用 户 函 数 接口 。 在 一 个 数组 中 为 Link 分 配 空间 , 并 将 其 成 


员 first、last、pre 和 suc 定义 为 int 类 型 (数组 下 标 ) 。 


. 与 C++ 标准 库容 器 ( 非 侵 入 式 ) 相 比 , 侵入 式 容器 的 优点 和 缺点 是 什么 ? 列 出 优 缺点 。 


8， 你 的 机 器 中 的 字典 序 是 怎样 的 ? 输出 你 的 键盘 上 的 每 个 字符 及 其 整数 值 。 然 后 , 按 整 数值 的 顺序 输出 所 


10. 


11. 
12. 


有 字符 。 

只 使 用 C 语言 特性 和 C 标准 库 ， 从 stdin 读 人 一 个 单词 序列 ,然后 按 字典 序 将 它们 输出 到 stdout。 提 示 : C 
中 的 排序 函数 称 为 qsort( ) , 查找 它 是 在 哪里 定义 的 , 使 用 它 来 完成 题目 。 另 一 种 方法 是 , 每 恋人 一 个 单 
词 ,就 将 它 插入 到 已 排序 的 列表 中 。C 标准 库 中 未 定义 列表 结构 。 

列 出 从 C++ 语言 或 支持 类 的 C 语言 中 借鉴 来 的 C 语言 特性 。 
列 出 没有 被 C++ 采纳 的 C 特性 。 
实现 一 个 支持 查找 功能 的 表 结 构 , 每 个 表 项 保存 一 个 G 风格 (string，int 对 ) , 支持 find ( struct table ” ， 


16. 


涡 27 共 mi6 证 言 0643 


const char” ) 、insert( struct table”，const char”, int) 以 及 remove( struct tabj@™, Gonstichar?  ) 寓 作 5%5 1 才 可 以 
用 一 个 struct 数组 或 者 一 对 数组 (const char"[ ] 和 int" ) 来 保存 , 你 可 以 选择 其 中 一 种 方式 。 函 数 返 回 类 
型 也 由 你 选择 。 编 写 文档 , 将 你 的 设计 决策 描述 清楚 。 


， 编写 C 程序 , 实现 string si cin > >si 相 同 的 功能 。 也 就 是 说 , 定义 一 个 输入 操作 , 读 人 任意 长 度 的 以 空 


白 符 结 尾 的 字符 序列 , 存 人 以 0 结尾 的 char 数组 中 。 


. 编写 函数 , 接受 一 个 int 数组 参数 , 找 出 其 中 的 最 小 值 和 最 大 值 , 并 计算 均值 和 中 值 。 使 用 一 个 struct 保 


存 结果 , 返回 值 就 设 定 为 这 个 struct。 


. 在 C 中 模拟 出 单 重 继承 。 令 每 个 " 基 类 "包含 一 个 指向 指针 数组 的 指针 (用 一 组 独立 函数 模拟 虚 函 数 , 每 


个 函数 的 第 一 个 参数 为 指向 一 个 “ 基 类 "对 象 的 指针 ) , 参考 27.2. 3 节 。“ 派 生 "” 机 制 实现 方式 为 : 将 派 
生 的 第 一 个 成 员 定义 为 “ 基 类 ”类 型 。 对 每 个 类 , 恰当 地 对 “和 虚 函数 "数组 进行 初始 化 。 为 了 测试 这 种 模 
拟 方 式 , 用 它 实现 “Shape”, 基 类 的 派生 类 的 draw( ) 只 是 简单 地 打印 类 名 。 在 完成 本 题 的 过 程 中 , 只 允 
许 使 用 标准 C 特性 和 C 标准 库 功 能 。 

使 用 宏 简化 上 一 题 中 的 符号 。 


人 》 附 言 


我 们 曾经 提 到 , 兼容 性 问题 不 那么 令 人 兴奋 。 然 而 , 已 经 有 大 量 的 ( 数 十 亿 行 )C 代码 “在 那里 "了 , 如 


果 你 必须 阅读 或 编写 C 代码 ,本 章 向 你 介绍 了 一 些 预备 知识 。 从 个 人 角度 , 我 更 倾向 于 使 用 C++ ,本 章 的 


一 些 内 容 也 给 出 了 部 分 原因 。 请 不 要 低估 “ 侵 人 式 List" 例 程 ,“ 侵 人 式 List" 和 不 透明 类 型 在 C 和 C++ 中 都 


是 非常 重要 和 强大 的 工具 。 


Lr 


术 语 表 


“通常 ， 几 个 恰如其分 的 单词 就 抵 得 上 上 千 幅 图 片 。 
一 一 匿名 


术语 表 ( glossary) 是 一 本 书 中 所 使 用 的 词汇 的 简单 解释 。 本 术语 表 相 当 简 短 , 只 列 出 了 我 们 
认为 最 基本 的 术语 (特别 是 在 学 习 程 序 设 计 的 早期 )。 书 中 每 章 的 “术语 "小节 也 有 相关 的 内 容 ， 
会 有 所 帮助 。 至 于 更 完整 的 C++ 术语 表 , 可 以 参考 www. research. att. com/ ~ bs/glossary. html, 在 
互联 网 上 你 还 可 以 找到 大 量 ( 质 量 各 异 的 ) 专 门 的 术语 表 。 请 注意 , 一 个 术语 可 能 具有 多 个 相关 的 
含义 (因此 我 们 偶尔 会 对 一 个 术语 列 出 多 个 意义 ), 而 我 们 列 出 的 大 多 数 术 语 在 其 他 领域 中 有 
( 弱 ) 相 关 的 含义 。 例 如 , 我 们 没有 按 现代 绘画 、 法 律 实践 以 及 哲学 中 的 相关 含义 来 定义 抽象 。 
abstract class( 抽象 类 ) ”不 能 用 来 直接 创建 对 象 的 类 ; 通常 用 于 定义 派生 类 的 接口 。 通 过 定义 一 

个 纯 虚 了 淆 数 或 者 一 个 受 保护 的 构造 泡 数 ,可 以 使 类 成 为 抽象 类 。 
abstraction ( 抽象 ) ”对 某 个 事物 的 描述 ,有 选择 、 有 目的 地 忽略 (隐藏 ) 了 细节 (如 实现 细节 ); 选 

择 性 的 忽略 。 
address( 地 址 ) ”一 个 值 , 可 以 帮助 我 们 在 计算 机 内 存 中 找到 某 个 对 象 。 
algorithm ( 算法) ”用 于 解决 某 个 问题 的 过 程 或 方法 , 能 生成 结果 的 有 限 的 计算 步骤 序列 。 
alias( 别名 ) 引用 对 象 的 另 一 种 方法 ; 通常 是 一 个 名 字 、 一 个 指针 或 一 个 引用 。 
application( 应 用 ) ”一 个 程序 或 者 一 组 程序 , 用 户 将 其 视 为 一 个 整体 。 
approximation( 近似 ) 与 完美 或 理想 的 结果 (一 个 值 或 一 个 设计 方案 ) 接 近 的 结果 ( 值 或 设计 )。 

通常 ,近似 是 在 理想 情况 间 折 衷 的 结果 。 
argument( 实 参 ) ”传递 给 函数 或 模板 的 值 , 通过 形 参 访问 。 
array ( 数组) 同 构 元 素 的 序列 , 元 素 通常 被 编号 , 如 [0: max ) 。 
assertion( 断言 ) ”插入 程序 中 的 语句 ,声明 ( 断言) 在 此 处 某 些 条 件 必须 为 真 。 
base class( 基 类 ) 在 类 层次 中 当做 基 使 用 的 类 。 通 常 基 类 包含 一 个 或 多 个 虚 函 数 。 
bit( 位 ) 计算 机 中 的 基本 信息 单元 。 一 个 位 的 值 可 以 是 0 或 1。 
bug( 错误 ) 程序 中 的 错误 。 
byte( 字 节 ) ”多数 计算 机 中 的 基本 寻 址 单元 。 一 个 字 节 通常 包含 8 位。 
class( 类 ) 用户 自 定义 类 型 ,可 以 包含 数据 成 员 、 成 员 函 数 和 成 员 类 型 。 
code( 代码 ) “一 个 程序 或 一 个 程序 片段 。 既 可 以 指 源 代 码 ， 又 可 以 指 目 标 代码 , 因此 容易 引起 

歧义 。 
compiler{ 编译 器 ) ”将 源 代码 转换 为 目标 代码 的 计算 机 程序 。 
complexity (复杂 性 ) 一 个 很 难 精 确定 义 的 概念 /度量 , 描述 构造 一 个 问题 的 解决 方案 的 困难 程 

度 , 或 者 解决 方案 本 身 的 困难 程度 。 有 时 用 来 (简单 地 ) 表示 对 执行 一 个 算法 所 需 操 作 次 数 

的 估计 。 
computation ( 计算 ) ” 茶 段 代码 的 执行 过 程 , 一 般 接受 一 些 输入 , 产生 一 些 输出 。 
concrete class ( 具体 类 ) 可 以 用 来 创建 对 象 的 类 。 
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constant ( 常量 ) (在 给 定 作 用 域内 ) 不 可 改变 的 值 ; 不 变量 。 

constructor( 构造 沙 数 ) ”初始 化 (“构造 ”) 对 象 的 操作 。 通 常 一 个 构造 函数 会 建立 起 一 个 不 变量 ， 
并 申请 对 象 所 需 的 资源 (这 些 资 源 通常 由 析 构 函数 释放 ) 。 

container ( 容器 ) ”容纳 元 素 ( 其 他 对 象 ) 的 对 象 。 

correctness( 正确 性 ) ” 当 一 个 程序 或 一 个 程序 片段 满足 规范 时 , 则 它 是 正确 的 。 不 幸 的 是 , 规范 
可 能 不 完整 或 不 一 致 , 或 不 满足 用 户 的 合理 期 望 。 因 此 , 为 了 生成 可 接受 的 代码 ,有 时 不 仅 
要 遵循 规范 , 还 要 做 得 更 多 。 

cost( 代价 ) ”生成 一 个 程序 或 者 执行 一 个 程序 的 花费 (如 程序 设计 时 间 、 运 行 时 间或 空间 ) 。 理 想 
情况 ,代价 应 是 复杂 性 的 函数 。 

data( 数据 ) ”计算 中 用 到 的 值 。 

debugging ( 调试 ) ”搜索 、 去 除 程序 中 错误 的 活动 , 与 测试 相 比 , 通常 缺乏 系统 性 。 

declaration ( 声明 ) ”程序 中 对 名 字 及 其 类 型 的 说 明 。 

definition ( 定义 ) 一 个 实体 的 声明 , 对 于 使 用 这 个 实体 的 程序 , 定义 提供 了 它 所 需要 的 完整 信 
息 。 简 化 定义 : 分 配 内 存 的 声明 。 

derived class( 派生 类 ) 从 一 个 或 多 个 基 类 派生 出 的 类 。 

design (设计) 一 个 总 体 描述 , 指出 一 个 软件 应 该 如 何 操作 来 满足 其 规范 。 

destructor ( 析 构 函数 ) ” 当 对 象 销毁 时 ( 如 在 作用 域 尾 ) 被 隐 式 调用 的 操作 。 通 常会 释放 资源 。 

encapsulation ( 封装 ) ”保护 那些 想 要 作为 私有 内 容 的 部 分 (如 实现 细节 ) 不 会 被 未 授权 者 访问 。 

error ( 错误) ”期望 的 程序 行为 (通常 表述 为 需求 或 用 户 指 南 ) 与 程序 的 实际 表现 不 匹配 。 

executable( 可 执行 ) ”可 在 计算 机 上 运行 (执行 ) 的 程序 。 

feature creep ( 功能 蔓延 ) ”向 程序 添加 过 多 功能 (而 只 是 为 了 “以 防 万 一 ”) 的 倾向 。 

file (文件 ) ”计算 机 中 保存 持久 信息 的 容器 。 

floating - point number ( 浮 点 数 ) ”实数 在 计算 机 中 的 近似 , 如 7.93 和 10.78e -3。 

function( 函数 ) ”命名 的 代码 单元 , 可 从 程序 中 不 同位 置 进行 调用 ; 计算 的 逻辑 单元 。 

generic programming ( 泛 型 程序 设计 ) 一 种 程序 设计 风格 , 关注 算法 的 设计 和 高 效 实现 。 一 个 
泛 型 算法 可 应 用 于 所 有 满足 其 要 求 的 实 参 类 型 。 在 C++ 中 , 泛 型 程序 设计 通常 使 用 模板 。 

header ( 头 文件 ) ”包含 声明 的 文件 , 其 中 的 声明 用 于 在 程序 的 不 同 部 分 之 间 共 享 接口 。 

hiding( 隐藏) 阻止 信息 片段 直接 可 见 或 直接 被 访问 的 动作 。 例 如 , 嵌入 的 (内 层 ) 作 用 域 中 的 名 
字 可 以 阻止 外 层 作 用 域 中 的 相同 名 字 被 直接 使 用 。 

理想 (ideal) 我们 追求 的 某 个 事物 的 完美 结果 。 但 通常 难以 获得 , 我 们 不 得 不 做 出 折衷 , 接受 一 
个 近似 结果 。 | 

implementation ( 实现 ) 1) 编写 和 测试 代码 的 动作 ; 2) 实现 某 个 程序 的 代码 。 

infinite loop (无 限 循环 ) ”终止 条 件 永 远 为 假 的 循环 。 参见 迭 代 (iteration ) 。 

infinite recursion ( 无 限 递归 ) ”直至 机 器 内 存 耗 尽 才 会 结束 的 递归 。 在 实际 中 , 这 种 递归 不 会 是 
无 限 的 , 会 终止 于 某 种 硬件 错误 。 

information hiding( 信息 隐藏 ) 将 接口 和 实现 分 离 的 动作 , 因此 隐藏 的 实现 细节 对 用 户 不 可 见 ， 
提供 了 一 个 抽象 。 

initiajize ( 初始 化 ) ”赋予 对 象 一 个 初 值 。 

input( 输 入 ) 计算 所 要 使 用 的 值 (例如 ， 隔 数 实 参 及 用 键盘 敲 入 的 字符 ) 。 
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integer ( 整数 ) 如 42 99 。 

interface 接口 ) 声明 或 一 组 声明 , 指出 一 段 代码 ( 如 一 个 函数 或 一 个 类) 如 何 被 调用 。 

invariant( 不 变量 ) Wye 或 某 几 个 位 置 ) 必须 始终 为 真 的 事物 ; 通常 用 来 描述 对 象 
的 状态 (一 组 值 ) 或 循环 进入 重复 语句 前 的 状态 

iteration (迭代) ”重复 执行 一 段 代 码 的 动作 ; 参见 北 归 ( fecursion ) 。 

iterator ( 迭代 器 ) ”标识 序列 中 元 素 的 对 象 。 

libray( 库 ) ”一 组 类 型 、 函 数 、 类 等 ,实现 了 一 组 功能 (抽象 ) ,可 能 被 很 多 程序 所 使 用 。 

lifetime( 生命 期 ) ”从 对 象 初始 化 到 其 不 可 用 (离开 作用 域 、 被 释放 或 程序 结束 ) 之 间 的 时 间 。 

linker( 链接 器 ) ”一 个 程序 , 将 目标 代码 文件 和 库 组 合 在 一 起 ， Et 了 程序 。 

literal ( 文字 常量 ) 一 个 符号 , 直接 指出 一 个 值 , 如 12 指出 整数 值 “ 十 二 

loop{ 循环 ) ”重复 执行 的 一 段 代码 ; 在 C++ 中 ,通常 是 一 条 for 语句 或 者 一 条 while 语句 。 

mutable{ 可 变 的 ) 可 改变 的 ; 与 不 可 变 的 、 常量 、 不 变量 相对 。 

object( 对 象 ) 1) 一 个 初始 化 过 的 已 知 类 型 的 内 存 区 域 , 保存 了 该 类 型 的 一 个 值 ; 2) 一 个 内 
存 区 域 。 

object code( 目标 代码 ) ”编译 器 的 输出 , 连接 器 的 输入 (连接 器 用 来 生成 可 执行 程序 ) 。 

object file( 目标 文件 ) ”包含 目标 代码 的 文件 。 

object-oriented Drogtamming (2 Wd 一 种 程序 设计 风格 , 关注 类 和 类 层次 的 设计 
与 使 用 。. 

operation ( 操作 ) ”可 执行 某 些 动作 的 事物 ， 如 函数 或 运算 符 。 

output ( 输出 ) 计算 生成 的 值 ( 例 如 ， 0 

overflow( 溢出 ) ”生成 的 值 无 法 存储 目标 。 

overload ( 重 载 ) 定义 两 个 具有 相同 名 字 但 参数 (运算 对 象 ) 类 型 不 同 的 函数 或 运算 符 。 

override( 覆盖 ) ”在 派生 类 中 定义 一 个 函数 ,其 名 字 和 参数 类 型 都 与 基 类 中 的 一 个 虚 蚂 数 完 全 相 
同 , 从 而 通过 基 类 的 接口 可 以 调用 此 函数 。 

paradigm ( 范 型 ) 人 点 自命 不 几 的 称谓 ; 通常 A 广 设 计 风 格 
优 于 其 他 。 

parameter ( 形 参 ) ee 在 函数 被 调用 时 , 可 以 通过 形 参 的 名 字 来 
访问 传递 来 的 实 

pointer ( 指针 ) 1) 让 从 用 于 识别 内 存 中 有 类 型 的 对 象 ; 2) 保存 这 样 一 个 信 的 变量 。 

post ~ condition ( 后 置 条 件 ) ”在 退出 一 段 代 码 (一 个 函数 或 一 个 循环 ) 时 必须 成 立 的 条 件 。 

pre -condition ( 前 置 条 件 ) ”在 进入 一 段 代码 (一 个 函数 或 一 个 循环 ) 时 必须 成 立 的 条 件 。 

program{ 程序 ) ”足够 完整 、 可 被 计算 机 执行 的 代码 (可 能 上 共 相 关联 的 数据 一 起 ) 

programming( 程序 设计 )， 将 问题 解决 方案 表达 为 代码 的 艺术 。 

programming language( 程序 设计 语言 ) ”表达 程序 的 语 育 。 

pseudo code( 伪 代码 ) ”用 非 正式 的 表示 方法 , 而 非 程 序 设计 语言 描述 的 计算 。 

pure virtual function( 纯 虚 函数 ) ”在 派生 类 中 必须 被 覆盖 的 奸 函 数 。 

Resource Acquisition Js Initialization ，RAIII 资源 获取 即 初 始 化 ) 一 种 基于 作用 域 的 资源 管理 基 
本 技术 。 

range( 范围 ) 值 的 序列 , 可 用 起 点 和 终点 来 描述 。 例 如 , [0: 5) 表 示 值 0、1、2、3 和 4。 
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regular expression ( 正则 表达 式 ) ”模式 的 一 种 字符 串 表 示 法 。 

recursion( 递归 ) ”函数 对 自身 的 调用 ; 参见 迭代 。 

reference( 引用 ) 1) 一 个 值 , 描述 了 内 存 中 一 个 有 类 型 值 的 位 置 ; 2) 保存 这 样 一 个 值 的 变量 。 

requirement( 要 求 ) 1) 对 于 一 个 程序 或 一 个 程序 片段 的 期 望 行为 的 描述 ; 2) 描述 了 一 个 函数 或 
一 个 模板 根据 其 参数 作出 的 假设 。 : 

resource( 资源 ) ”使 用 前 必须 申请 ， 使 用 后 应 应 该 释放 的 事物 , 如 文件 句柄 、 锁 或 内 存 。 

rounding( 舍 入 ) “将 一 个 值 转换 为 数学 上 最 接近 的 、 低 精度 类 型 的 值 。 

scope 作用 域 ) 名 字 可 以 被 访问 的 程序 文本 ( 源 代码 ) 区域。 

sequence (序列 ) ”可 以 按 线性 次 序 访问 的 一 些 值 。 

software( 软件 ) ”代码 片段 和 关联 的 数据 的 集合 ; 通常 可 以 与 程序 字 互 换 使 用 。 

source code( 源 代 码 ) 程序 员 生 成 的 代码 ， (理论 上 ) 其 他 程序 员 可 读 。 

source file( 源 文件 ) ”包含 源 代码 的 文件 。 

specification ( 规范 ) ”描述 了 一 段 代 码 应 该 做 什么 。 

standard ( 标准) ”官方 认可 的 某 事 物 的 定义 ， 如 程序 设计 语言 。 

state ( 状态 ) ”一 组 值 。 

string( 字符 串 ) ”字符 序列 。 

style( 风格 ) 一 组 程序 设计 技术 , 可 保证 一 致 地 使 用 语言 特性 ; 有 时 使 用 其 狭义 含义 : 指 代码 的 
命名 和 外 观 形式 的 低层 规则 。 

subtype( 子 类 型 ) 派生 的 类 型 ; 具有 另 一 个 类 型 的 所 有 属性 ， 可 能 还 有 更 多 的 属性 。 

supertype( 超 类 型 ) ” 基 类 型 ; 属性 为 另 一 个 类 型 的 属性 的 子 集 。 

system ( 系统 ) ”1) 一 个 程序 或 一 组 程序 ， 目的 是 在 一 台 计 算 机 上 执行 某 个 任务 ; 2)“ 操 作 系统 ” 
的 简称 ， 即 计算 机 上 的 基本 执行 环境 和 工具 。 

template ( 模板 ) ”由 一 个 或 多 个 类 型 或 (编译 时 ) 值 所 参数 化 的 类 或 函数 ; 用 来 支持 泛 型 程序 设计 
的 基本 C++ 语 言 特性 。 

testing ( 测试 ) ”查找 程序 中 错误 的 系统 化 方法 。 

trade -off( 折 囊 ) 在 多 种 设计 和 实现 标准 之 间 的 权衡 。 

truncation (截断 ) ”从 一 个 类 型 转换 到 为 一 个 类 型 的 过 程 中 ， 由 于 目标 状态 无 法 准确 表示 要 转换 
的 值 ， 从 而 丢失 了 信息 。 

type( 类 型 ) 定义 了 一 组 可 能 值 及 一 组 操作 。 

uninitialized ( 未 初始 化 ) ”对象 在 初始 化 之 前 的 (未 定义 ) 状态。 

unit( 单位 /单元 ) 1) 标准 度量 , 使 得 值 具有 实际 意义 (如 千 米 , 度量 距离 ); 2) 整体 中 区 别 于 其 

”他 的 (如 命名 的 ) 部 分 。 : 

，use case ( 用 例 ) 程序 的 特定 (通常 是 人 和音 ) 的 使 用 方式 ,可 以 测试 各 序 的 功能 、 必 展示 其 目的 。 

value( 值 ) 内 存 中 的 一 组 二 进 制 位 , 按 某 种 类 型 解释 其 意义 。 

variable( 变量 ) ”给 定 类 型 的 命名 对 象 ; 除非 未 初始 化 , 否则 包含 一 个 值 。 

virtual function( 虚 函 数 ) 可 在 派生 类 中 覆盖 的 成 员 函 数 。. 

word ( 字 ) 计算 机 中 内 存 的 基本 单元 ， 通常 对 应 一 个 整数 。 
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